Die fabelhafte Welt der Mathematik: Verrat oder Kooperation? Das wohl bekannteste Dilemma der Mathematik
So gut wie jede Person begegnet irgendwann dem Gefangenendilemma. Während meiner Schulzeit kam ich erstmals mit einer Variante des Phänomens in Berührung. Damals wiesen meine beste Freundin und ich identische Ergebnisse in einer Mathe-Klassenarbeit auf, und unser Lehrer war stinksauer. »Entweder ihr sagt mir, wer abgeguckt hat, und nur eine von euch bekommt eine 5«, warnte er uns, »oder ihr schweigt beide und bekommt beide eine 5.« Wir standen also vor der Wahl: uns gegenseitig verraten oder miteinander kooperieren.
Die Situation entsprach nicht ganz dem klassischen Gefangenendilemma: Der Lehrer ließ uns nur die Option, zu schweigen (also miteinander zu kooperieren, wodurch beide eine 5 bekommen) oder den Täuschungsversuch preiszugeben (nur eine von uns bekommt eine 5). Dass wir beide die jeweils andere Person verraten könnten beziehungsweise beide eine Täuschung zugeben, hatte der Lehrer nicht erwogen – und wir auch nicht, wenn ich ehrlich bin. Aus psychologischer Sicht wäre das wahrscheinlich interessant gewesen. Mathematisch betrachtet hat die Situation hingegen eine einfache, eindeutige Lösung: Verrat zahlt sich aus.
Um das zu verstehen, wandle ich das Szenario aus meiner Schulzeit leicht ab, damit es dem tatsächlichen Gefangenendilemma entspricht. Angenommen, unser Lehrer hätte uns vor folgende Wahl gestellt:
- Falls wir beide schweigen (also miteinander kooperieren), bekommen wir beide eine 3.
- Falls eine von uns schweigt, die andere aber ihre Komplizin verrät, dann bekommt die Schweigende eine 5, die andere eine 1.
- Falls beide sich gegenseitig verraten, bekommen beide eine 4.
Nach dem Erklären der Regeln verhört er uns beide getrennt voneinander, so dass wir nicht wissen, wie die andere Person aussagt. Wie würden Sie sich entscheiden? Würden Sie Ihrer Freundin beistehen und schweigen oder würden Sie sie verraten?
Egoismus zahlt sich aus
Auf den ersten Blick wirkt es so, als sollten beide miteinander kooperieren, da so der beste Ausgang für beide Personen gewährleistet ist: Beide bekommen eine 3, was durchaus annehmbar ist. Wenn man diesen Fall jedoch nüchtern aus der Perspektive einer Person analysiert, gibt es nur eine rationale Lösung. Falls die Komplizin schweigt (und damit kooperiert), ist es vorteilhaft, sie zu verraten. Denn dann bekommt man eine 1. Falls die Komplizin die Person hintergeht, ist es für letztere ebenfalls vorteilhafter, einen Verrat zu begehen, denn dann bekommt sie eine 4 statt einer 5. Unabhängig davon, wie die andere Seite also handelt: Durch Verrat gewinnt man stets einen Vorteil.
Damit ist das Gefangenendilemma – zumindest aus mathematischer Sicht – also gar nicht so spannend. Ganz anders sieht es hingegen aus, wenn man das Problem wiederholt: Die zwei Personen also unendlich oft vor dieselbe Wahl stellt, wodurch sie auf zurückliegende Handlungen reagieren und entsprechend ihre Strategien anpassen können.
Angenommen, ich hätte zum Beispiel meine Freundin an den Mathematiklehrer verraten, sie hätte aber zu mir gehalten und geschwiegen. In diesem Fall wäre das Vertrauen zwischen uns beiden zerstört. Wenn uns also unsere Biologielehrerin nach einer Klassenarbeit vor die gleiche Wahl stellen würde, kann man davon ausgehen, dass meine Freundin wahrscheinlich nicht mehr schweigen würde. Doch was, wenn ich dieses Mal zu ihr hielte? Wie würde sie sich dann bei einer dritten, ähnlichen Situation verhalten?
Auge um Auge
Lange nahmen Fachleute an, dass es beim iterierten Gefangenendilemma keine eindeutige Strategie gibt, die allen anderen überlegen ist. Wie gut eine Person abschneidet, hängt immer von der Spielweise des Gegenübers ab. Zum Beispiel könnte eine Person immer eine Münze werfen, um zu entscheiden, ob sie kooperiert (k, etwa bei Zahl) oder Verrat übt (v, etwa bei Kopf). Der Komplize könnte hingegen zuerst kooperieren (k) und sein Handeln anschließend von der letzten Entscheidung des Gegenübers abhängig machen: Falls die andere Person kooperiert hatte, kooperiert er auch, falls er hingegen verraten wurde, handelt er entsprechend. Diese Strategie ist als Auge um Auge bekannt.
Auf diese Weise könnte folgende Abfolge von sechs Handlungen entstehen: (v, k), (k, v), (k, k), (v, k), (k, v), (v, k). Die Person mit der Münzwurfstrategie würde demnach folgende Noten erhalten: 1, 5, 3, 1, 5, 1, und somit einen Notenschnitt von 2,67 haben. Die Person mit der Auge-um-Auge-Strategie bekommt hingegen folgende Noten: 5, 1, 3, 5, 1, 5, und damit einen Durchschnitt von 3,33. Sie würde also schlechter abschneiden.
Tatsächlich ist das immer der Fall. Mit einem Auge-um-Auge-Vorgehen kann man niemals ein besseres Ergebnis erzielen als die andere Person, da man immer zeitversetzt auf sie reagiert und mit einer Kooperation startet. Dennoch erweist sich die alttestamentarische Strategie im Mittel als überraschend Gewinn bringend.
Ein Turnier verschiedener Strategien
Um herauszufinden, welche Vorgehensweise sich beim wiederholten Gefangenendilemma am meisten auszahlt, hat der Politikwissenschaftler Robert Axelrod seine Kolleginnen und Kollegen im Jahr 1980 herausgefordert: Sie sollten verschiedene Strategien programmieren, damit er sie auf einem Computer simulieren konnte. Jedes Programm trat 200-mal gegen jedes andere an.
Insgesamt hatten Axelrods Kollegen 14 Algorithmen eingereicht, er selbst fügte noch einen 15. hinzu, der zufällig (wie bei einem Münzwurf) operierte. Das Ergebnis seines Experiments war erstaunlich: Als vorteilhafteste Strategie erwies sich Auge um Auge, obwohl man auf diese Weise niemals besser abschneidet als der Mitspieler. Doch wie sich herausstellt, erzielt man mit dieser Strategie niemals besonders schlechte Resultate, egal wie die andere Person spielt.
Und Axelrod stellte eine andere Tatsache fest, Die acht besten Strategien waren allesamt »freundlich«. Sie beginnen immer mit einer Kooperation und verraten ihr Gegenüber erst dann, wenn sie selbst hintergangen wurden. Im wiederholten Gefangenendilemma scheint sich also ein völlig anderes Verhalten durchzusetzen als beim einmaligen Szenario: Verrat lohnt sich nicht, sondern Kooperation.
16 Jahre später veranstaltete Axelrod einen weiteren Wettbewerb, bei dem 63 Programme mit unterschiedlichen Strategien eingereicht wurden. Wieder ließ Axelrod sie gegeneinander antreten – und erneut zeichnete sich ein ähnliches Bild ab: Die Auge-um-Auge-Strategie erwies sich insgesamt am gewinnbringendsten, und unter den Top-15-Strategien fand sich nur eine, die nicht freundlich gesinnt ist.
Die Ergebnisse veranlassten Axelrod, vier Merkmale zu identifizieren, die erfolgreiche Algorithmen beim wiederholten Gefangenendilemma aufweisen:
- Freundlichkeit: Sie verraten niemals zuerst ihr Gegenüber.
- Schnelle Reaktion: Sie reagieren schnell auf die Handlungen ihres Gegenübers (und nicht erst nach vielen Schritten).
- Nicht nachtragend: Wenn man verraten wurde, sollte man im Lauf des Spiels in der Lage sein, zu verzeihen.
- Nicht zu komplex: Die meisten Gewinn bringenden Strategien sind recht einfach gehalten.
Das schien mit den Prinzipien, die sich in der Natur durchgesetzt haben, zusammenzupassen. Wenn man das Tierreich betrachtet, findet man häufig kooperatives Verhalten: Vampirfledermäuse spenden zum Beispiel einen Teil ihrer Mahlzeit an Mitglieder ihre Artgenossen, die keine Beute finden. Manche Vogel- und Insektenarten helfen sich gegenseitig dabei, ihren Nachwuchs großzuziehen. Selbst bei Bakterien wurde schon beobachtet, dass sie sich gegenseitig helfen. Doch 2012 schien eine neu erschienene Forschungsarbeit mit solchen Erkenntnissen aufzuräumen.
Alle Vorstellungen über den Haufen geworfen
Der Physiker Freeman Dyson und der Informatiker William Press veröffentlichten »Iterated Prisoner's Dilemma contains strategies that dominate any evolutionary opponent« (auf Deutsch: Das iterierte Gefangenendilemma enthält Strategien, die jeden evolutionären Gegner dominieren), das mit dem meisten Wissen brach, das man zum Gefangenendilemma gesammelt hatte: Sie bewiesen, dass es eine Strategie gibt, die alle anderen übertrifft. Und darüber hinaus fußt diese auf egoistischem Verhalten.
Es gibt also doch eine Strategie, mit der man stets besser dran ist als das Gegenüber – unabhängig davon, wie dieses sich verhält. Die Idee besteht darin, mit einer bestimmten Wahrscheinlichkeit irgendwann die andere Person zu verraten, auch wenn diese bisher nur kooperiert hat. Man muss die Wahrscheinlichkeit geschickt wählen, damit man immer besser abschneidet als die andere Person. Dieser Ansatz wird als Null-Determinanten-Strategie bezeichnet.
Kurz nach Erscheinen der bahnbrechenden Arbeit von Press und Dyson wurden die Null-Determinanten-Strategien einem Praxistest ausgesetzt, indem Fachleute erneut ein Turnier simulierten. Die Ergebnisse bestätigten die Behauptungen von Dyson und Press: Ihr Ansatz setzte sich durch – wenn auch nur sehr knapp. Ein freundlicher Auge-um-Auge-Ansatz schnitt fast ebenso gut ab.
Wie die Forschenden herausfanden, lohnt sich in der Praxis kooperatives Verhalten. Denn sobald man sich realistischeren Szenarien widmet, bei denen es nicht nur zwei Personen gibt, die miteinander interagieren, sondern hunderte oder gar tausende, sind kooperative Ansätze gewinnbringender als die Strategie von Dyson und Press.
Beim abgewandelten Gefangenendilemma, das sich unser Lehrer ausgedacht hatte, entschied sich meine Freundin dafür, ihren Täuschungsversuch zuzugeben. Sie kassierte die schlechte Note, während ich glimpflich davonkam. Hätten meine Freundin und ich damals in der Schule mehr über das Gefangenendilemma gewusst, hätten wir vielleicht anders auf das Angebot unseres Lehrers reagiert. Hätten wir aber generell beide mehr von Mathematik und Spieltheorie verstanden, wäre Schummeln wahrscheinlich überhaupt nicht nötig gewesen – und wir wären gar nicht erst in diese Situation gekommen.
Sie haben auch ein Lieblingsthema zu Mathematik und würden gerne mehr darüber in dieser Kolumne lesen? Dann schreiben Sie es mir gerne in die Kommentare!
Schreiben Sie uns!
3 Beiträge anzeigen