Direkt zum Inhalt
Login erforderlich
Dieser Artikel ist Abonnenten mit Zugriffsrechten für diese Ausgabe frei zugänglich.

Informatik: Spielend Lernen

Die neuesten Versionen künstlicher Intelligenz wachsen ohne einprogrammiertes Vorwissen innerhalb weniger Stunden zu Weltklassespielern heran. Nun versuchen Forscher diese Systeme über das Spielbrett hinaus auf Probleme in Alltag und Wissenschaft anzuwenden – was nach wie vor knifflig ist.
Roboter spielt Schach

Als Maschinen erstmals die talentiertesten Meister übertrafen, mussten sie dazu noch von Menschen erlangtes Wissen nutzen. Beispielsweise hatten Ingenieure von IBM ihren Computer Deep Blue, der 1997 den ehemaligen Schachweltmeister Garri Kasparow schlug, zuvor mit jahrhundertelanger Schacherfahrung gespeist. Auch AlphaGo, das Googles Tochterunternehmen DeepMind entwickelt hat, verfügte über Millionen verschiedener Züge aus Zehntausenden von Menschen gespielten Go-Partien, als es den koreanischen Profi Lee Sedol besiegte.

Doch nun überdenken Informatiker die Art und Weise, wie Programme das vorhandene menschliche Wissen einsetzen sollen. Der aktuelle Trend lautet, es schlicht zu ignorieren.

Im Oktober 2017 veröffentlichte das DeepMind-Team ein neues Go-System, AlphaGo Zero, das überhaupt keine menschlichen Spiele mehr studierte. Stattdessen lernte es lediglich die Regeln und trat gegen sich selbst in den Kampf. Die ersten Züge des Bots erfolgten dabei völlig zufällig. Nach jedem Spiel lernte die Maschine aber, was einen Sieg begünstigt und was nicht. Am Ende des Trainings stieg AlphaGo Zero gegen seinen Vorläufer AlphaGo in den Ring. Die selbstlernende Maschine gewann das Turnier mit dem sensationellen Ergebnis von 100 zu 0.

Das Team entwickelte daraufhin AlphaGo Zero weiter, um erneut einen autodidaktischen Meisterspieler zu konstruieren, den sie der Einfachheit halber nur noch AlphaZero nannten. Und auch diese Version übertraf ihren Vorgänger – sie schlug den Bot, der den Bot schlug, der die besten Go-Spieler der Welt schlug. Anders als seine Vorgänger ist AlphaZero nicht nur auf Go spezialisiert. Als es die Regeln für Schach oder die japanische Schachvariante Shogi erhielt, besiegte das Programm innerhalb kürzester Zeit die dafür maßgeschneiderten Top-Level-Algorithmen. Experten staunten über den aggressiven und ungewöhnlichen Stil des Programms. »Ich habe mich immer gefragt, wie es wäre, wenn eine überlegene Spezies auf die Erde käme und uns zeigen würde, wie sie Schach spielt«, sagte der dänische Großmeister Peter Heine Nielsen in einem BBC-Interview. »Jetzt weiß ich es.« ...

Kennen Sie schon …

Spektrum - Die Woche – Wie Computer das Lernen lernen

Die Nobelpreise in Medizin oder Physiologie, Physik und Chemie sind vergeben! Erfahren Sie, wie bahnbrechende Forschungen zu microRNA, neuronalen Netzen und Proteinen die Welt verändern.

Spektrum - Die Woche – Warum soziale Medien weniger gefährlich sind, als wir denken

Spektrum Kompakt – Extremwetter

Auf der ganzen Welt sind Menschen von Extremwetterereignissen betroffen. In Zukunft werden sich diese aufgrund des Klimawandels häufen. So nehmen Starkregen, Dürren und Waldbrände auch in Europa zu. Welche Maßnahmen bei Extremwetter gibt es und wie zuverlässig lassen sich »freak events« vorhersagen?

  • Quellen

Byron, S.: Carnegie Mellon Artificial Intelligence Beats Top Poker Pros. In: CMU/News, 2017

Mnih, V. et al.: Playing Atari with Deep Reinforcement Learning. In: ArXiv 1312.5602, 2013

Silver, D. et al.: Mastering the Game of Go without Human Knowledge. In: Nature 550, S. 354-359, 2017

Silver, D. et al.: Mastering Chess and Shogi by Self-Play with a General Reinforcement Learning Algorithm. In: ArXiv 1712.01815, 2017

Schreiben Sie uns!

Beitrag schreiben

Wir freuen uns über Ihre Beiträge zu unseren Artikeln und wünschen Ihnen viel Spaß beim Gedankenaustausch auf unseren Seiten! Bitte beachten Sie dabei unsere Kommentarrichtlinien.

Tragen Sie bitte nur Relevantes zum Thema des jeweiligen Artikels vor, und wahren Sie einen respektvollen Umgangston. Die Redaktion behält sich vor, Zuschriften nicht zu veröffentlichen und Ihre Kommentare redaktionell zu bearbeiten. Die Zuschriften können daher leider nicht immer sofort veröffentlicht werden. Bitte geben Sie einen Namen an und Ihren Zuschriften stets eine aussagekräftige Überschrift, damit bei Onlinediskussionen andere Teilnehmende sich leichter auf Ihre Beiträge beziehen können. Ausgewählte Zuschriften können ohne separate Rücksprache auch in unseren gedruckten und digitalen Magazinen veröffentlicht werden. Vielen Dank!

Bitte erlauben Sie Javascript, um die volle Funktionalität von Spektrum.de zu erhalten.