Künstliche Intelligenz: AlphaGo besiegt sich selbst
Bereits im Frühjahr 2016 übertrumpfte ein Computerprogramm einen der weltbesten menschlichen Spieler im asiatischen Strategiespiel Go. Nun hat die Google-Tochterfirma DeepMind, die "AlphaGo" programmiert, eine verbesserte Version des Algorithmus präsentiert. "AlphaGo Zero" bringt sich das Spiel selbstständig bei, muss also nicht mehr auf die Erfahrungen menschlicher Spieler zurückgreifen. Trotzdem konnte die Software ihr Vorgängerprogramm in 100 von 100 ausgefochtenen Partien besiegen, berichtet das Team um David Silver.
Das jahrtausendealte Brettspiel Go ist erheblich komplexer als Schach, da es deutlich mehr Möglichkeiten für Züge gibt. Computer waren lange auch deshalb daran gescheitert, Profis zu bezwingen, weil diese auf einen über Jahrzehnte gewachsenen Erfahrungsschatz zurückgreifen können.
AlphaGo gelang schließlich der Durchbruch, da seine Programmierer ein neuronales Netz mit Daten aus 30 Millionen Partien menschlicher Spieler gefüttert hatten und so der Software für etliche Spielsituationen den jeweils besten Zug beibrachten.
Die neue Version kommt ohne menschlichen Erfahrungsschatz aus. AlphaGo Zero bekam lediglich die Spielregeln vorgegeben und trat dann immer wieder gegen sich selbst an. Dabei wählte die Software die Züge zunächst nach dem Zufallsprinzip aus, merkte sich dabei aber jeweils, ob eine Entscheidung den Sieg näherbrachte – Informatiker nennen dieses Vorgehen "reinforcement learning".
Um seinen Vorgänger zu schlagen, benötigte das Programm nur ein paar Trainingstage, in denen es jedoch fast fünf Millionen Spiele gegen sich selbst absolvierte. Die künstliche Intelligenz entdeckte dabei einige derselben erfolgreichen Taktiken, die Menschen entwickelt hatten – und darüber hinaus noch weitere, die schließlich den Unterschied machten.
Schreiben Sie uns!
Beitrag schreiben