Direkt zum Inhalt

Spieltheorie: Wie KI das professionelle Pokerspiel verändert

Auf der Suche nach der optimalen Spielstrategie greifen professionelle Pokerspieler inzwischen auf KI zurück. Trotzdem kann es sinnvoll sein, die Tipps der Computerprogramme zu ignorieren.
Pokerchips
Das Pokerspiel hat sich in den letzten Jahren stark verändert – ein Grund dafür ist der KI-Boom.

»All in.« Ihr Gegenüber schiebt einen großen Stapel Chips über den Pokertisch. Sie werfen einen Blick auf Ihre Karten, ein Sechser-Paar. Sie spielen Texas Hold'em. Es sind nur Sie und Ihr Gegner übrig, und es wurden noch keine offenen Karten ausgeteilt. Sie haben daher nur zwei Möglichkeiten: mitgehen (auch »callen« genannt) oder aussteigen. Wie entscheiden Sie sich?

Professionelle Spieler achten in solchen Situationen auf jedes Detail. Wie verhielt sich ihr Gegenspieler vor dem All-in? Wer hat wie gehandelt? Wie viele Chips hat jeder und wie viele sind im Pott? Wann werden die Blinds, also die erzwungenen Einsätze erhöht? Und wie wahrscheinlich ist es, dass zwei Sechser gewinnen? Pokerprofis haben verschiedene Spielstrategien studiert und Wahrscheinlichkeitstabellen auswendig gelernt. Angenommen, in der oben geschilderten Spielsituation wäre Aussteigen die beste Entscheidung. Sie haben aber über ein längeres Turnier hinweg festgestellt, dass Ihr Gegenüber dazu neigt, mit mittelmäßigen Karten trotzdem hoch zu pokern. Bleiben Sie Ihrem Training treu und steigen aus – oder passen Sie Ihre Strategie spontan an, um die beobachtete Schwäche auszunutzen?

Die Frage, ob man die optimale oder die »ausbeuterische« Strategie anwenden soll, wird aktuell unter professionellen Pokerspielern heiß diskutiert. Die mathematischen Grundlagen reichen zwar 80 Jahre zurück, aber die Fortschritte im Bereich der künstlichen Intelligenz (KI) rücken das Thema wieder in den Vordergrund. Neue KI-Anwendungen lehren Pokerspieler die optimale Strategie – warum sollten sie sie ignorieren?

Was ist schon optimal?

Dass es eine Spielform gibt, die aus objektiver Sicht optimal ist, erscheint bei einem Spiel wie Poker, das auf zufällig verteilten Karten und chaotischer menschlicher Psychologie basiert, kontraintuitiv. Ein Beispiel dafür ist das Bluffen, bei dem ein Spieler vorgibt, ein gutes Blatt zu haben, damit der Gegner aufgibt. Das Lügen über die eigenen Karten ist von Natur aus psychologisch und widersetzt sich reiner Objektivität. Aber Mathematiker haben gelernt, auch menschliches Verhalten in sachliche Gleichungen zu gießen.

Das Buch »Theory of Games and Economic Behavior« des Mathematikers John von Neumann und des Wirtschaftswissenschaftlers Oskar Morgenstern aus dem Jahr 1944 legte die modernen Grundlagen der Spieltheorie, bei der es um die mathematische Beschreibung von menschlichem Verhalten geht. In diesem Werk wird Poker als zentrales Beispiel angeführt. Die Autoren untersuchten jedoch eine vereinfachte Variante, die das Spiel auf seine grundlegendste Dynamik reduziert: Zwei Spieler erhalten jeweils eine Zahl zwischen 0 und 1 (höhere Zahlen stehen für stärkere Blätter) und wetten dann, wer die höchste hat. Von Neumann und Morgenstern bewiesen nicht nur, dass es eine optimale Strategie gibt, sondern auch, dass dabei Bluffen ein wesentlicher Bestandteil ist.

Natürlich ist Texas Hold'em sehr viel komplexer als dieses Beispiel. Wer kann schon sagen, ob es überhaupt eine optimale Strategie für ein vollwertiges Pokerspiel mit mehreren Spielern gibt? Tatsächlich konnte das der renommierte Mathematiker John Nash beweisen, den viele aus dem 2001 erschienenen Film »A Beautiful Mind« kennen.

In den 1950er Jahren trieb Nash das damals aufkommende Gebiet der Spieltheorie voran, wofür er 1994 mit dem Nobelpreis für Wirtschaftswissenschaften geehrt wurde. Seine berühmteste Entdeckung, das Nash-Gleichgewicht, liegt vor, wenn kein Spieler von seiner gewählten Strategie abweicht, weil er seine Situation sonst verschlechtern würde (vorausgesetzt, die anderen halten an ihrem Plan fest).

Von Mahjong bis Magic: The Gathering – jedes endliche Spiel besitzt mindestens ein Nash-Gleichgewicht

Spieltheoretiker betrachten diese Bedingung als optimal. Wenn Sie und ich ein Spiel spielen, bei dem jeder von uns mit einer beliebigen Strategie beginnt, ich dann meine Strategie anpasse, um einen Vorteil aus Ihrem Verhalten zu ziehen, Sie daraufhin eine Gegenanpassung an meine Änderung vornehmen und so weiter, werden wir irgendwann einen Zustand erreichen, bei dem sich keiner weiter verbessern kann. Die Spieler können ihre Strategien sogar im Voraus ankündigen, und trotzdem wird es für alle am besten sein, sich an das Nash-Gleichgewicht zu halten. 1950 bewies John Nash auf nur einer Seite, dass jedes endliche Wettbewerbsspiel – von Mahjong bis Magic: The Gathering – mindestens ein Nash-Gleichgewicht besitzt. Und damit auch Texas Hold'em.

Trotz ihres Namens umfasst die Spieltheorie ein breites Spektrum an Themen, die über gewöhnliche Spiele hinausgehen, darunter Wirtschaftssysteme, nukleare Abschreckung und Evolutionsbiologie. Fachleute betrachten Spiele stets als Interaktionen von rationalen Entscheidungsträgern, deren Handlungen und Auszahlungen sich genau definieren und untersuchen lassen. Dass jedes endliche von Wettbewerb getriebene Spiel eine optimale Strategie besitzt, hat also weit reichende Auswirkungen – auch beim Pokerspiel, von dem man zuvor annahm, dass sich eine Gewinnstrategie hauptsächlich auf Bauchgefühl und Menschenkenntnis stützt.

Die KI-Revolution

Nur weil man weiß, dass es bei Texas Hold'em ein Nash-Gleichgewicht gibt, heißt das noch lange nicht, dass man auch die optimale Spielstrategie kennt. Je komplexer die Spiele sind, desto schwieriger ist es, sie zu finden.

Jeder kann in Windeseile lernen, wie man sich fehlerfrei bei »Drei gewinnt« verhält. Man muss sich dafür nur ein paar Zugfolgen merken. Bei einem komplizierteren Spiel wie Dame (das bei perfektem Spiel immer unentschieden endet) ist es hingegen unmöglich, sich genügend Varianten einzuprägen, um die optimale Strategie umzusetzen. Fachleute haben jedoch Algorithmen entwickelt, die optimal Dame spielen. Dafür speichern die Computer riesige Datenbanken mit verschiedenen Positionen und durchsuchen die möglichen Spielverläufe.

Doch selbst für Computer stellen komplexe Spiele eine Herausforderung dar: Zwar können Schachcomputer seit etwa 25 Jahren die besten menschlichen Spieler schlagen, dennoch verfolgen die Rechner noch nicht die optimale Strategie.

Und bei Poker gibt es anders als beim Schach nur unvollständige Informationen. Die Spieler kennen zwar ihre eigenen Karten, nicht aber die ihrer Gegner, was es schwieriger macht, das Spiel mathematisch zu modellieren. Das erklärt, warum die algorithmische Revolution im Poker erst mit dem jüngsten KI-Boom kam.

»Poker wurde von einer unscharfen Kunst zu einer harten Wissenschaft«Liv Boeree, ehemalige Profi-Pokerspielerin

Im Jahr 2015 veröffentlichten Informatiker einen Algorithmus, der für eine eingeschränkte Pokerversion mit nur zwei Spielern und begrenzten Einsatzhöhen ein perfektes Spiel angibt. Vier Jahre später gab es die erste KI für Texas Hold'em mit mehreren Spielern. Es folgte eine Flut kommerziell erhältlicher Software-Tools, so genannter Solver. Innerhalb weniger Jahre hatten professionelle Pokerspieler ihre KI-Programme zur Hand, die angeben, wie man in welcher Situation spielen sollte.

»Das Spiel wurde von einer unscharfen Kunst zu einer harten Wissenschaft«, sagt die ehemalige professionelle britische Pokerspielerin Liv Boeree. Um heute die Nase vorn zu haben, nutzen fortgeschrittene Spieler Computerprogramme wie PioSOLVER, das optimale Strategien annähert. Für einfache und häufige Situationen lernen Profis die maschinellen Empfehlungen auswendig. Für Elite-Pokerspieler ist die Vorbereitung mit diesen Solvern inzwischen unerlässlich. »Wenn man um hohe Einsätze gegen die Besten spielen will, wird man bei lebendigem Leib aufgefressen, wenn man keine Solver benutzt«, berichtet Boeree. »Es gab einige Spieler, die das ganze Konzept einfach ablehnten und nicht mit Solvern arbeiteten. Die meisten von ihnen blieben auf der Strecke.«

Manche der gängigen Weisheiten über Texas Hold'em wurden durch die KI-Modelle bestätigt – andere widerlegt. So galt unter Profispielern das »Donk Betting« (eine Runde mit einem Einsatz beginnen, wenn man die vorherige mit einem Call beendet hat) meist als amateurhaftes Spiel, doch computergestützte Studien haben die Nützlichkeit dieser Strategie bestätigt. Und wie sich herausstellt, spielen KI-Programme häufiger in Situationen weiter, bei denen erfahrene Menschen dazu neigen, auszusteigen.

Allerdings spielen die Multiplayer-Poker-Solver so wie Schachprogramme in der Regel kein optimales Spiel. Dafür ist Poker bisher zu komplex. Trotzdem übertreffen die Computer menschliche Spieler inzwischen bei Weitem, so dass man sich viel von ihnen abgucken kann.

Auch Irrationalität hat ihre Berechtigung

Beim Nash-Gleichgewicht geht man davon aus, dass kein Spieler seine Situation jemals verschlechtert. Wenn ein anderer Spieler das dennoch macht, ist es oft klug, darauf zu reagieren.

Ein anschauliches Beispiel dafür ist Stein-Schere-Papier. Die optimale Strategie besteht darin, zufällig zwischen Stein, Papier und Schere zu wählen. Selbst wenn man diesen Weg im Voraus ankündigt, wird ein Gegenspieler das nicht ausnutzen können. Wenn zwei Personen mit dieser Strategie gegeneinander antreten, werden sie wahrscheinlich jeweils die Hälfte der Runden gewinnen. Aber angenommen, eine Person weicht davon ab; sie könnte zum Beispiel immer Papier wählen. Wenn der Gegenspieler die Zufallsstrategie beibehält, gewinnt er immer noch die Hälfte aller Spiele. Er könnte jedoch auch die irrationale Strategie des Gegenübers ausnutzen und immer die Schere zücken.

Selbst bei weniger dramatischen Abweichungen von der optimalen Spielstrategie gibt es Möglichkeiten, von den Schwächen des Gegners zu profitieren. Denn die optimale Strategie, die zum Nash-Gleichgewicht führt, ist die einzige, die sich nicht ausnutzen lässt. Empirische Untersuchungen zu Schere-Stein-Papier zeigen zum Beispiel, dass Menschen, die eine Runde gewinnen, mit etwas höherer Wahrscheinlichkeit das Symbol wiederholen, mit dem sie gerade siegreich waren. Dieses Wissen bietet Vorteile. Wenn Sie zum Beispiel gegen Stein verloren haben, sollten Sie als Nächstes Papier spielen, weil Ihr Gegner wieder Stein zeigen könnte.

Während sich Pokerspieler von KI-Programmen optimale Techniken abgucken, lernen sie auch, wann ihre Gegner nicht optimal spielen

Dasselbe gilt für Poker, allerdings in einem viel komplizierteren Rahmen. Während sich die Spieler von KI-Programmen optimale Techniken abgucken, lernen sie auch herauszufinden, wann ihre Gegner nicht optimal spielen – und wie sie davon am besten Gebrauch machen.

Aber es gibt einen Haken: Wenn ein Gegner in vorhersehbarer Weise vom Nash-Gleichgewicht abweicht, könnten Sie das zwar ausnutzen; in diesem Fall entfernen Sie sich jedoch ihrerseits vom Gleichgewicht und machen sich selbst dadurch angreifbar. Wenn Ihr Gegner immer nur Papier zeigt und Sie anfangen, mit Schere zu reagieren, wird es Ihr Gegenüber irgendwann merken und anfangen, auf Ihre Scheren mit Steinen einzuschlagen.

Der ehemalige Pokerprofi Igor Kurganow drückt es so aus: »Jedes Mal, wenn Sie einen Fehler Ihres Gegners aufdecken, verbessern Sie Ihr Modell, wie er über das Spiel denkt. Sie passen Ihr Spiel an, um diesen Fehler zu berücksichtigen, und werden dadurch selbst verwundbar.«

Auf den höchsten Ebenen des Pokerspiels sind sich die meisten einig, dass sie eine Mischung aus optimalem und ausbeuterischem Spiel anwenden müssen, um wettbewerbsfähig zu bleiben. Eine optimale Taktik ist eher defensiv, während ausbeuterische Strategien tendenziell offensiv sind. Einige Pokertrainer empfehlen, ein Turnier mit der optimalen Weise zu beginnen – und erst dann, nach Beobachtung der Schwächen des Gegners, die ausbeuterischen Züge einzustreuen. Die Flexibilität, zwischen verschiedenen Strategien zu wechseln, trennt die Spreu vom Weizen. »Dieser ganze Prozess funktioniert umso besser, je sicherer Sie sich sind, dass Sie mehr über das Spiel wissen als Ihr Gegenüber«, erklärt Kurganow. »Sie nehmen weniger ausbeuterische Anpassungen vor, wenn Sie das Gefühl haben, dass Ihr Gegner genauso gut oder besser ist als Sie.«

»Es fühlt sich so an, als ob KI dem Spiel ein wenig von seiner Magie genommen hätte«Liv Boeree, ehemalige Profi-Pokerspielerin

Durch den KI-Boom hat Poker für manche Spielerinnen und Spieler seinen Reiz verloren. Für Boeree, die sich 2019 aus dem Profipoker zurückgezogen hat, fühlt es sich so an, »als ob es dem Spiel ein wenig von seiner Magie genommen hätte, so nach dem Motto: ›Jetzt ist das Rätsel gelöst‹«. Sie ist jetzt als Wissenschaftskommunikatorin, Philanthropin und Podcasterin tätig.

Andere vertreten hingegen die Meinung, dass Computer dem Spiel eine neue Ebene verliehen haben. Es gibt jedenfalls weiterhin keinen Mangel an Enthusiasmus auf dem Gebiet. »Seit Covid boomt es«, sagt Boeree. »An der World Series of Poker haben 2023 mehr teilgenommen als je zuvor. Rekorde werden gebrochen. Poker ist alles andere als tot.«

WEITERLESEN MIT »SPEKTRUM +«

Im Abo erhalten Sie exklusiven Zugang zu allen Premiumartikeln von »spektrum.de« sowie »Spektrum - Die Woche« als PDF- und App-Ausgabe. Testen Sie 30 Tage uneingeschränkten Zugang zu »Spektrum+« gratis:

Jetzt testen

(Sie müssen Javascript erlauben, um nach der Anmeldung auf diesen Artikel zugreifen zu können)

  • Quellen

Bowling, M. et al.: Heads-up limit hold’em poker is solved. Science 347, 2015

Brown, N. et al.: Superhuman AI for multiplayer poker. Science 365, 2019

Schreiben Sie uns!

Wenn Sie inhaltliche Anmerkungen zu diesem Artikel haben, können Sie die Redaktion per E-Mail informieren. Wir lesen Ihre Zuschrift, bitten jedoch um Verständnis, dass wir nicht jede beantworten können.

Partnerinhalte

Bitte erlauben Sie Javascript, um die volle Funktionalität von Spektrum.de zu erhalten.