Direkt zum Inhalt

Künstliche Intelligenz: Algorithmus lernt Computerspielen

Ein Computerprogramm bringt sich selbstständig Atari-Spiele bei.
Inside DeepMind

Veröffentlicht am: 24.02.2015

Laufzeit: 0:08:15

Sprache: englisch

Nature, 10.1038/d41586-023-03325-7, 2023

Wer kennt heute noch das Atari-Spiel Space Invaders aus den 1970ern? Die Forscher und Programmierer der britischen DeepMind, einer 2014 von Google aufgekauften Firma, die sich auf künstliche Intelligenz spezialisiert hat, offensichtlich schon. Um einen neuen Algorithmus zu trainieren, griffen sie nämlich auf dieses und auch auf einige andere Spiele von Atari zurück.

Der im Video vorgestellte Demis Hassabis ist Hauptautor der am 25. Februar 2015 im britischen Fachmagazin Nature veröffentlichten Studie Human-level control through deep reinforcement learning, die den Algorithmus beschreibt. (Anm.: Nature gehört ebenso wie Spektrum der Wissenschaft zum Holtzbrinck-Konzern.) Hassabis war früher ein Schachwunderkind, später wandte er sich dem Thema Künstliche Intelligenz zu und gründete DeepMind. Hier erklärt er der Nature-Reporterin Elizabeth Gibney, wie die Software arbeitet. Der Algorithmus nimmt das Spiel, bei dem er mit einer Kanone auf heranrückende Aliens schießen muss, erst einmal wie ein kleines Baby wahr, ohne es zu verstehen – er "sieht" nur, was das Display des Atari-Computers zeigt. So ist er außerdem über den laufenden Punktetstand infomiert.

Anfangs drückt der Algorithmus zufällig und wahllos die Spieltaste, um zu sehen was passiert. Dann lernt er allmählich und selbstständig, wie er seinen Punktestand erhöhen kann. In einem Beitrag im Guardian erfährt man darüber hinaus, dass die Entwickler auf das so genannte verstärkende Lernen gesetzt haben, eine Methode maschinellen Lernens, die auf Belohnungs- und Bestrafungsmechanismen beruht. Der Guardian-Artikel erwähnt auch, wie gut sich der Algorithmus geschlagen hat: Bei einigen Atari-Spielen war er menschlichen Spielern überlegen, bei anderen tat er sich schwerer.

Seine Leistungsgrenze ist aber noch lange nicht erreicht. Bislang mangelt es ihm unter anderem an einem leistungsfähigen "Gedächtnis" – sobald ihm seine Entwickler eines spendieren (was allerdings weitere aufwändige Forschungsarbeit bedeutet), wird er auch Langzeitstrategien verfolgen können.

Schreiben Sie uns!

Beitrag schreiben

Wir freuen uns über Ihre Beiträge zu unseren Artikeln und wünschen Ihnen viel Spaß beim Gedankenaustausch auf unseren Seiten! Bitte beachten Sie dabei unsere Kommentarrichtlinien.

Tragen Sie bitte nur Relevantes zum Thema des jeweiligen Artikels vor, und wahren Sie einen respektvollen Umgangston. Die Redaktion behält sich vor, Zuschriften nicht zu veröffentlichen und Ihre Kommentare redaktionell zu bearbeiten. Die Zuschriften können daher leider nicht immer sofort veröffentlicht werden. Bitte geben Sie einen Namen an und Ihren Zuschriften stets eine aussagekräftige Überschrift, damit bei Onlinediskussionen andere Teilnehmende sich leichter auf Ihre Beiträge beziehen können. Ausgewählte Zuschriften können ohne separate Rücksprache auch in unseren gedruckten und digitalen Magazinen veröffentlicht werden. Vielen Dank!

Partnerinhalte

Bitte erlauben Sie Javascript, um die volle Funktionalität von Spektrum.de zu erhalten.