Mathematische Unterhaltungen: Das Ende des Gefangenendilemmas

Zusammenhalt oder Verrat? Seit 75 Jahren ist das Gefangenendilemma die wohl bekannteste Simulation der Spieltheorie. Eine logische Analyse führt zu einer neuen Behandlung des Problems – und zu einem Ausweg.

von Ralf Bülow

Ein komplexes, blaues Labyrinth mit hohen Wänden, in dessen Mitte eine goldene Waage schwebt. Die Waage symbolisiert Gerechtigkeit und Balance. Das Bild vermittelt ein Gefühl von Herausforderung und Suche nach Gleichgewicht. Es gibt keine sichtbaren Texte oder URLs im Bild. — © Flavio Coelho / Getty Images / Moment (Ausschnitt)
Welcher Weg und welche Entscheidungen sind die richtigen?

Alice und Bob sind des Rechnens müde, sie möchten etwas Aufregendes erleben. Am nächsten Morgen gibt es einen entleerten Geldautomaten, und in den Wohnungen von Alice und Bob liegen viele Scheine herum. Allerdings sind sie dabei nicht besonders vorsichtig vorgegangen, so dass schnell die Polizei anrückt und die beiden festnimmt. Weil die Beweise nicht ausreichen, werden Alice und Bob getrennt und zeitgleich verhört.

Gesteht Alice das Aufbrechen des Automaten, kommt sie frei, und falls Bob schweigt, wandert er fünf Monate ins Gefängnis. Gleiches gilt umgekehrt für Bob: Entlassung bei Geständnis und fünf Monate für die schweigende Komplizin. Wenn dagegen beide gestehen, müssen sie für drei Monate hinter Gitter. Sollten beide schweigen, gäbe es für jeden nur einen Monat Haft – wegen Steuerhinterziehung.

Wie sollten die Angeklagten am besten handeln? Darum dreht sich das Gefangenendilemma, das vermutlich bekannteste Problem der mathematischen Spieltheorie. Die zwei Übeltäter und ihre Verhöre erfand der in Princeton lehrende kanadische Mathematiker Albert Tucker, als er im Mai 1950 ein Rechenbeispiel für einen Vortrag suchte. Eine ähnliche Variante des Dilemmas hatten bereits kurz zuvor die in der kalifornischen RAND Corporation tätigen Mathematiker Melvin Dresher und Merrill Flood erdacht; bei ihnen ging es um einen harmlosen Autoverkauf.

Dank Tuckers prägnanter Formulierung sprach sich das Problem in der ganzen Welt herum – 2025 feiern wir den 75. Geburtstag. Die klassische Lösung des Gefangenendilemmas ist jedoch paradox; es könnte daher sinnvoll sein, das Problem neu auszulegen.

Reden oder schweigen – vertrauen oder hintergehen?

Die üblicherweise vorgebrachte Lösung lässt sich wie folgt zusammenfassen. Alice weiß: Falls Bob schweigt und sie gesteht, wäre sie frei. Und falls er reden würde, wäre sie mit einem Geständnis ebenfalls besser dran. Sie und Bob erhielten zwar eine Strafe von drei Monaten; würde sie allerdings nichts sagen, müsste sie schlimmstenfalls für fünf Monate in den Knast. Bob denkt genauso in Bezug auf Alice. Deshalb gestehen beide den Raub und werden für ein Vierteljahr eingebuchtet. Die Logik ist unerbittlich; aber gemeinsames Schweigen hätte schon nach einem Monat die Entlassung gebracht.

Das Gefangenendilemma ist der Doppelspaltversuch der Spieltheorie

Dieser Widerspruch zwischen Rationalität und Realität ist der Kern des Gefangenendilemmas. Die Lösung erscheint abwegig und erinnert an die kontraintuitive Quantentheorie; das Gefangenendilemma ist sozusagen der Doppelspaltversuch der Spieltheorie.

Logikerinnen und Logiker haben das Problem willig ertragen, und es wurde zu einem Klassiker der Entscheidungstheorie, der Sozialpsychologie und der Wirtschaftswissenschaft. Nach der Einführung durch Albert Tucker widmete sich die Forschung vor allem einer Weiterentwicklung des Problems, dem iterierten Gefangenendilemma. Hier werden das Verbrechen und die Bestrafung mehrfach wiederholt, so dass die Täter in späteren Runden auf frühere Aktionen des jeweiligen Partners reagieren können.

Die Lösung des »one-shot prisoner's dilemma« wurde nie ernsthaft angezweifelt, obwohl sie neben der Widersinnigkeit einen logischen Fehler aufweist. Alice betrachtet zwei Situationen – Bobs Geständnis und sein Schweigen – und leitet daraus jedes Mal ab, dass ein Geständnis für sie lohnenswerter ist. Sie nimmt also eine abgeschlossene Handlung von Bob in der externen Welt an, auf die sie nach den Regeln der Logik reagiert. Eine solche Handlung von Bob gibt es aber nicht.

Im nächsten Argumentationsschritt werden die Gedanken von Alice auf Bob übertragen; er betrachtet die zwei verschiedenen Handlungsweisen seiner Partnerin (Gestehen oder Schweigen), kommt zum gleichen Ergebnis und gesteht. Kurz gesagt, Alice richtet sich danach, was Bob tat, und Bob orientiert sich daran, was Alice machte. So etwas kann jedoch beim besten Willen nicht funktionieren.

Die korrekte logische Analyse untersucht deshalb nicht zwei Fälle, sondern vier:

Alice gesteht – Bob gesteht	Alice gesteht – Bob schweigt
Alice schweigt – Bob gesteht	Alice schweigt – Bob schweigt

Die Folgen der Handlungskombinationen lassen sich ebenfalls in einer Tabelle zusammenfassen. In jedem Eintrag ist links die Strafe beziehungsweise Nichtstrafe für Alice und rechts jene für Bob vermerkt. Ein Geständnis beschert der gestehenden Person drei Monate Gefängnis oder die Freiheit, kein Geständnis setzt sie entweder einen oder fünf Monate fest.

	Bob
Alice		Geständnis	Schweigen
	Geständnis	3 – 3	0 – 5
	Schweigen	5 – 0	1 – 1

Gestehen minimiert also die größtmögliche Haftzeit. Man sitzt höchstens drei Monate ein, während Schweigen im schlimmsten Fall zu fünf Monaten hinter Gittern führt. In der Spieltheorie spricht man vom Minimax-Prinzip. Die gestehende oder schweigende Person kann wenig für sich selbst tun; sie bestimmt vor allem das Schicksal der anderen Person. Ihr bringt das Geständnis drei oder fünf Monate Gefängnis ein; falls sie hingegen schweigt, kann sie sich entweder über die Freilassung freuen oder bloß einen Monat einsitzen. Eine Handlung, die direkt der handelnden Person selbst zugutekommt, ist unmöglich.

In der öffentlichen Variante verschwindet also das Dilemma

Das Gefangenendilemma ist so aufgebaut, dass es außer der simplen Minimax-Strategie keine vernünftige Lösung gibt. Denkbar ist jedoch eine kleine Änderung: Alice und Bob werden gemeinsam verhört. In diesem Fall werden sie gemeinsam schweigen und so einen Monat Haft kassieren. Denn sobald eine Person gesteht, würde die andere (um die fünf Monate im Gefängnis zu vermeiden) ebenfalls gestehen (was beiden drei Monate Haft brächte). In dieser öffentlichen Variante verschwindet also das Dilemma.

Napoleon und Wellington im Dilemma

Das gilt ebenso für eine leicht abgewandelte Form des Problems, das an eine Situation im 19. Jahrhundert angepasst wurde. Im Waterloo-Dilemma treten die Heerführer Wellington und Napoleon gegeneinander an. Sie überlegen, ob sie den Gegner angreifen oder eine Kampfpause einlegen. Falls sie sich für Letzteres entscheiden, könnte das jeweils ruhende Heer aber vom anderen angegriffen und überwunden werden. Bei einem beidseitigen Angriff ergäbe sich eine Schlacht mit vielen Opfern. Verlustfrei wäre eine Waffenruhe, die allerdings keiner Seite einen Sieg brächte.

	Napoleon
Wellington		Angriff	Pause
	Angriff	blutige Schlacht	Wellington siegt
	Pause	Napoleon siegt	Waffenruhe

Hierbei gilt: Ein Sieg wäre besser als eine Kampfpause und eine Pause besser als eine Schlacht. Am schlechtesten dran ist die Partei, die sich während einer Auszeit überfallen lässt. Die Spieltheorie ruft zur Schlacht auf, weil diese der Niederlage durch einen Überfall vorzuziehen ist und ein Sieg die Waffenruhe schlägt.

Das beiderseitige Wissen führt – anders als bei der historischen Wahrheit – zur Waffenruhe

Im Waterloo-Dilemma gibt es dasselbe Problem wie bei Alice und Bob, wenn sie Geldautomaten leeren: Die Fragestellung schließt eine Strategie aus. Die Lösung ergibt sich auch hier durch Offenheit. Wellington und Napoleon beobachten sich, und jeder weiß, dass die Hinweise auf einen Angriff eine Schlacht auslösen würden. Das beiderseitige Wissen führt – anders als bei der historischen Wahrheit – zur Waffenruhe.

Die immense Bedeutung von Information zeigt sich deutlich in einer anderen Version des Problems, dem »Tauschdilemma«, das der Mathematiker und Informatiker Douglas Hofstadter erdacht hat. In diesem Fall geht es nicht um eine Straftat, sondern um Geschenke. Alice verspricht Bob, ihm einen wertvollen Gegenstand zu schenken, und umgekehrt. Alice und Bob deponieren die Präsente in Schließfächern an unterschiedlichen Orten und tauschen dann die jeweiligen Schlüssel aus. Nun stellt sich die Frage, ob Alice und Bob ihr Versprechen halten – oder den wertvollen Gegenstand für sich behalten und ein leeres Schließfach hinterlassen.

Wieder lässt sich eine Tabelle mit den vier denkbaren Situationen erstellen.

	Bob
Alice		Behalten	Deponieren
	Behalten	leer – leer	Objekt* – leer*
	Deponieren	leer* – Objekt*	Objekt – Objekt

Der linke Teil der Einträge beschreibt, was Alice vorfindet; der rechte Abschnitt ist der Inhalt von Bobs Schließfach. Die Sternchen bezeichnen die Situationen, in denen Alice und Bob unterschiedliche Inhalte vorfanden; also in denen einer von beiden das Geschenk behielt. Die Resultate lassen sich der Größe nach ordnen, etwa nach dem Grad der Zufriedenheit der Beteiligten:

leer* < leer < Objekt < Objekt*

Anders als beim Gefangenendilemma geht es beim Tauschdilemma nicht um die Minimierung von Werten, etwa von Haftzeiten, sondern um Maximierung. Die logischen Konflikte bleiben trotzdem bestehen. Die klassische Spieltheorie liefert als Lösung das Paar: leer – leer. Wenn sich Alice und Bob jedoch nichts schenken, verliert der geplante Tausch seinen Sinn. Das Tauschdilemma lässt sich nicht lösen, stattdessen verdeutlicht es, dass die Logik in diesem Fall in eine Sackgasse führt.

Das Tauschproblem offenbart den wahren Kern des Gefangenendilemmas: Es ist der Wunsch, die andere Partei übers Ohr zu hauen

Das Geben und Nehmen von Objekten benötigt ein Mindestmaß an Offenheit und erfolgt am besten mit den Beteiligten. Alice und Bob könnten sich also treffen, ihre Sachen auf den Tisch legen und mit dem jeweils anderen Objekt von dannen ziehen. Auch der Austausch von Spionen und Geheimdienstlern ist ein Beispiel für das Dilemma – dieser vollzieht sich unter genau festgelegten Bedingungen, wie an der Glienicker Brücke bei Berlin.

Damit offenbart das Tauschproblem den wahren Kern des Gefangenendilemmas. Es ist der Wunsch, die andere Partei übers Ohr zu hauen. Die optimale Spielstrategie führt am Ende aber zu zwei betrogenen Betrügern. Somit stellt sich die Frage, ob das wirklich der beste Ausweg aus dem Dilemma ist – und ob es nicht doch sinnvoller wäre, in der Theorie noch einmal von vorn anzufangen.

Allerdings ist es nicht möglich, für die Originalfassung des Gefangenendilemmas ein beiderseitiges Schweigen als optimale Strategie nachzuweisen, klassisch-logisch und ohne Tricks. Daher müssen wir uns von der Idee verabschieden, dass jede Paradoxie oder paradox wirkende Fragestellung eine zufrieden stellende Erklärung hat. Wir können Alice und Bob also nur helfen, wenn wir an der Fragestellung selbst drehen.

Eine frühere Version des Artikels erschien in den »Mitteilungen der Deutschen Mathematiker-Vereinigung«, Heft 32-4 (2024).

Schreiben Sie uns!

Wenn Sie inhaltliche Anmerkungen zu diesem Artikel haben, können Sie die Redaktion per E-Mail informieren. Wir lesen Ihre Zuschrift, bitten jedoch um Verständnis, dass wir nicht jede beantworten können.

Artikel zum Thema