Informatik: Spielend Lernen

Dieser Artikel ist Abonnenten mit Zugriffsrechten für diese Ausgabe frei zugänglich.

Informatik: Spielend Lernen

Die neuesten Versionen künstlicher Intelligenz wachsen ohne einprogrammiertes Vorwissen innerhalb weniger Stunden zu Weltklassespielern heran. Nun versuchen Forscher diese Systeme über das Spielbrett hinaus auf Probleme in Alltag und Wissenschaft anzuwenden – was nach wie vor knifflig ist.

Joshua Sokol

Roboter spielt Schach — © LightFieldStudios / Getty Images / iStock (Ausschnitt)

Als Maschinen erstmals die talentiertesten Meister übertrafen, mussten sie dazu noch von Menschen erlangtes Wissen nutzen. Beispielsweise hatten Ingenieure von IBM ihren Computer Deep Blue, der 1997 den ehemaligen Schachweltmeister Garri Kasparow schlug, zuvor mit jahrhundertelanger Schacherfahrung gespeist. Auch AlphaGo, das Googles Tochterunternehmen DeepMind entwickelt hat, verfügte über Millionen verschiedener Züge aus Zehntausenden von Menschen gespielten Go-Partien, als es den koreanischen Profi Lee Sedol besiegte.

Doch nun überdenken Informatiker die Art und Weise, wie Programme das vorhandene menschliche Wissen einsetzen sollen. Der aktuelle Trend lautet, es schlicht zu ignorieren.

Im Oktober 2017 veröffentlichte das DeepMind-Team ein neues Go-System, AlphaGo Zero, das überhaupt keine menschlichen Spiele mehr studierte. Stattdessen lernte es lediglich die Regeln und trat gegen sich selbst in den Kampf. Die ersten Züge des Bots erfolgten dabei völlig zufällig. Nach jedem Spiel lernte die Maschine aber, was einen Sieg begünstigt und was nicht. Am Ende des Trainings stieg AlphaGo Zero gegen seinen Vorläufer AlphaGo in den Ring. Die selbstlernende Maschine gewann das Turnier mit dem sensationellen Ergebnis von 100 zu 0.

Das Team entwickelte daraufhin AlphaGo Zero weiter, um erneut einen autodidaktischen Meisterspieler zu konstruieren, den sie der Einfachheit halber nur noch AlphaZero nannten. Und auch diese Version übertraf ihren Vorgänger – sie schlug den Bot, der den Bot schlug, der die besten Go-Spieler der Welt schlug. Anders als seine Vorgänger ist AlphaZero nicht nur auf Go spezialisiert. Als es die Regeln für Schach oder die japanische Schachvariante Shogi erhielt, besiegte das Programm innerhalb kürzester Zeit die dafür maßgeschneiderten Top-Level-Algorithmen. Experten staunten über den aggressiven und ungewöhnlichen Stil des Programms. »Ich habe mich immer gefragt, wie es wäre, wenn eine überlegene Spezies auf die Erde käme und uns zeigen würde, wie sie Schach spielt«, sagte der dänische Großmeister Peter Heine Nielsen in einem BBC-Interview. »Jetzt weiß ich es.« ...

Download (Abo)

Kennen Sie schon …

Spektrum der Wissenschaft - 2/2025 - KI als Kopilot — Spektrum der Wissenschaft – KI als Kopilot
Künstliche Intelligenz ist immer öfter an mathematischen Durchbrüchen entscheidend beteiligt. Der Mathematiker Terence Tao erklärt im Interview, wie Beweisprüfer und KI-Programme die Arbeit der Fachleute ändern können. Daneben berichten wir über Waschbären, die in Deutschland und Europa weiter auf dem Vormarsch. Wir zeigen, welche Folgen diese invasive Art für Menschen und Ökosysteme hat. Im dritten Teil unserer Serie »50 Jahre Lucy« geht es um die 1925 veröffentlichte Erstbeschreibung des *Australopithecus africanus*: Raymond Dart führte damit eine neue Gattung für die Vorfahren des Menschen ein, die in der Fachwelt zunächst auf wenig Gegenliebe stieß. Ein weiterer Artikel widmet sich der Erzeugung von menschlichen Embryonen mit Hilfe der Stammzellenforschung und auch den daraus resultierenden ethischen Fragen.

Spektrum der Wissenschaft Spezial Biologie - Medizin - Hirnforschung - 1/2025 - Chemie des Lebens — Spektrum der Wissenschaft – Chemie des Lebens
Leben ist Chemie. Molekulare Strukturen und chemische Reaktionen liefern die Grundlage sämtlicher biologischer Systeme. Dank des Einsatzes moderner Computertechniken sowie künstlicher Intelligenz gelingt es immer besser, den räumlichen Aufbau von Proteinen vorherzusagen. Dies eröffnet ungeahnte Möglichkeiten in der Medizin und Arzneimittelforschung. Zunehmend nutzen Forschungsgruppen unkonventionelle Ansätze, setzen etwa elektrochemische Methoden ein oder schicken sich an, die innere Ringstruktur von Wirkstoffmolekülen zu verändern, um das gewünschte Mittel zusammenzubauen.

Spektrum der Wissenschaft – KI als Kopilot

Künstliche Intelligenz ist immer öfter an mathematischen Durchbrüchen entscheidend beteiligt. Der Mathematiker Terence Tao erklärt im Interview, wie Beweisprüfer und KI-Programme die Arbeit der Fachleute ändern können. Daneben berichten wir über Waschbären, die in Deutschland und Europa weiter auf dem Vormarsch. Wir zeigen, welche Folgen diese invasive Art für Menschen und Ökosysteme hat. Im dritten Teil unserer Serie »50 Jahre Lucy« geht es um die 1925 veröffentlichte Erstbeschreibung des Australopithecus africanus: Raymond Dart führte damit eine neue Gattung für die Vorfahren des Menschen ein, die in der Fachwelt zunächst auf wenig Gegenliebe stieß. Ein weiterer Artikel widmet sich der Erzeugung von menschlichen Embryonen mit Hilfe der Stammzellenforschung und auch den daraus resultierenden ethischen Fragen.

Quellen
Links im Netz

Byron, S.: Carnegie Mellon Artificial Intelligence Beats Top Poker Pros. In: CMU/News, 2017

Mnih, V. et al.: Playing Atari with Deep Reinforcement Learning. In: ArXiv 1312.5602, 2013

Silver, D. et al.: Mastering the Game of Go without Human Knowledge. In: Nature 550, S. 354-359, 2017

Silver, D. et al.: Mastering Chess and Shogi by Self-Play with a General Reinforcement Learning Algorithm. In: ArXiv 1712.01815, 2017

DeepMind (Kooperation von DeepMind und Blizzard Entertainment)
Vice (Microsoft Chatbot)
DeepMind (Verstärkendes Lernen)
OpenAI (Dota-2 Bot von OpenAI)
OpenAI (Verstärkendes Lernen und OpenAI)
STAT (IBM Watson in der Krebsforschung)
Folding@Home (Proteine Falten )
Foldit (Proteine falten als Spiel)

Schreiben Sie uns!

Beitrag schreiben

Beitrag darf veröffentlicht werden

Wir freuen uns über Ihre Beiträge zu unseren Artikeln und wünschen Ihnen viel Spaß beim Gedankenaustausch auf unseren Seiten! Bitte beachten Sie dabei unsere Kommentarrichtlinien.

Tragen Sie bitte nur Relevantes zum Thema des jeweiligen Artikels vor, und wahren Sie einen respektvollen Umgangston. Die Redaktion behält sich vor, Zuschriften nicht zu veröffentlichen und Ihre Kommentare redaktionell zu bearbeiten. Die Zuschriften können daher leider nicht immer sofort veröffentlicht werden. Bitte geben Sie einen Namen an und Ihren Zuschriften stets eine aussagekräftige Überschrift, damit bei Onlinediskussionen andere Teilnehmende sich leichter auf Ihre Beiträge beziehen können. Ausgewählte Zuschriften können ohne separate Rücksprache auch in unseren gedruckten und digitalen Magazinen veröffentlicht werden. Vielen Dank!

Artikel zum Thema

Beim Go-Spiel setzen die beiden Spieler abwechselnd einen Stein ihrer Farbe (schwarz beziehungsweise weiß) auf einen der 19·19 Schnittpunkte eines quadratischen Gitters. Im ersten Zug stehen also 361 Möglichkeiten zur Auswahl, danach entsprechend weniger, was immer noch weit mehr ist als die durchschnittlich 30 bis 35 Zugmöglichkeiten beim Schach.

Künstliche Intelligenz: AlphaGo – Computer lernen Intuition

Wie eine künstliche Intelligenz den Weltmeister im Go-Spiel besiegte - eine Errungenschaft mit weit reichenden Konsequenzen.