Ihre Beiträge sind uns willkommen! Schreiben Sie uns Ihre Fragen und Anregungen, Ihre Kritik oder Zustimmung. Wir veröffentlichen hier laufend Ihre aktuellen Zuschriften.
Genau in dem Sinne, den Herr Pöppe in seiner Antwort auf meinen ersten Leserbrief "Irrationale Spieltheoretiker" als rational im Sinne der Spieltheorie definiert, ist mein in diesem Leserbrief beschriebenes Verhalten rational und das Verhalten der Spieltheoretiker, welches zum Nash-Gleichgewicht führt, irrational.
Das Problem ist hier nicht der Begriff der Rationalität, sondern der Algorithmus, der diese Rationalität abbilden soll. Hier versagt die Spieltheorie vollständig. Das wollte der Autor mit seinem Artikel ja auch aufzeigen. Er zieht hier nur völlig falsche Schlüsse, weil er den Begriff der Rationalität selbst als gefährdet ansieht und nicht nur dessen algorithmische Abbildung. (Zitat: "Die Tatsache, dass das Nash-Gleichgewicht [als Versuchsergebnis] nicht vorkommt, zeigt wiederum, dass der Mensch nicht rational entscheidet - oder vielmehr, dass die übliche Vorstellung von rationalem Verhalten revisionsbedürftig ist.")
Dass dies wirklich so ist und der Autor nicht nur mit der Mehrdeutigkeit des Begriffes der Rationalität spielt, wie Herr Pöppe in seiner Antwort unterstellt, zeigt die Passage, in der der Autor seine eigenen Gedanken in einem Urlauber-Dilemma beschreibt. (Zitat: "Zum Kuckuck mit der Spieltheorie. Ich spiele einfach eine hohe Zahl, sagen wir 95") Hier zeigt sich, dass er völlig den Faden verloren hat und in seiner Hilflosigkeit völlig irrational handeln würde. Die ansonsten für die Mehrheit der Menschen offensichtliche (im Sinne der Spieltheorie) rationale Lösung ist er nicht mehr in der Lage zu erkennen.
In dieser Ratlosigkeit kommt es dann unter anderem zur unfassbaren und empörenden Unterstellung, dass sich viele Menschen aus Dummheit einfach für die optimale Lösung entscheiden. Ich kann da nur sagen, wer mit dem Finger auf andere zeigt, bei dem zeigen vier Finger auf einen selbst. (Zitat: "... die naheliegende[!] Theorie von der Trägheit des Geistes. Viele Spieler seien schlichtweg nicht fähig oder willens, die gedanklichen Schritte hin zum Nash-Gleichgewicht zu vollziehen, weswegen ihre Entscheidung unweigerlich irrational ausfalle") Na, darüber sollte die Menschheit wirklich froh sein!!! (Falls diese Worte nicht vom Autor selbst stammen, sondern von Herrn Rubinstein, dessen Untersuchungsergebnisse der Autor an dieser Stelle analysiert, hat der Autor dennoch versäumt dies entsprechend kenntlich zu machen und sich dann davon zu distanzieren)
Aber auch hier zeigt sich erneut deutlich die Unfähigkeit, zwischen Rationalität und deren algorithmischen Abbildung zu unterscheiden. Für einen Wissenschaftler ein wirklich blamabler Fehler. Anscheinend ist davon aber nicht nur der Autor, sondern die ganze Zunft der Spieltheoretiker betroffen.
Ich denke, ich habe in meinem ersten Leserbrief aufzeigen können, dass es eine halbwegs saubere algorithmische Lösung des Problems gibt, die der Prämisse der Rationalität aus der Spieltheorie exakt entspricht und zum Optimum (100,100) führt. Ich bin kein Mathematiker, sondern Informatiker. Mir reicht das als Beweis, dass es hier nicht um eine Krise des Rationalitätsbegriffes der Spieltheorie selbst geht, sondern lediglich um ein algorithmisches. Die Suche nach dem Nash-Gleichgewicht als Lösungsstrategie ist offensichtlich (und wahrscheinlich auch grundsätzlich) ein falscher Ansatz und muss durch eine andere Ermittlung der Gewinnmaximierung ersetzt werden. Das ist alles.
Sämtliche Folgerungen, die der Autor aus dieser vermeintlichen Krise zieht, haben also keine Grundlage und sind daher wertlos. Viel bleibt dann jedoch nicht mehr vom Artikel übrig.
Wieso wird als Bewertungsfunktion eigentlich ein singulärer Funktionswert genommen und nicht z .B. der Erwartungswert (das "Integral" über die möglichen Antworten bei gewählter Wahl eines Wertes)? Ich würde dann jene Zahl als beste bewerten, die die maximale erwartete Auszahlung bringt. Und das genau ist es meiner Meinung nach, was Menschen machen. Sie versuchen, den Erwartungswert zu maximieren. Nur: Sie können es niemals "wirklich". In meinem Sinn wäre die Strategie der Wahl beim ursprünglichen Urlauberdilemma mit den Parametern (2, 100, 2) gleich 96 und bei dem Problem mit (180, 300, 5) gleich 290. Und Menschen tippen meist knapp daneben.
Ein Beispiel zu dem Vorgehen: Ich wähle 100. Der Partner kann die Werte 2, 3, 4, …,99, 100 wählen, was für mich die Auszahlungen 0, 1, 2, …97, 100 ergibt. Wenn ich jeder Wahl des Partners die gleiche Wahrscheinlichkeit zuweise (die dann 1/99 ist), ergibt sich für meine Auszahlung der Erwartungswert (1/99 )* (0+1+2+...+97+100) = 49,0202
Nun maximiere ich das über alle möglichen Wahlen meines eigenes Wertes und bekomme: Die beste Wahl ist 96 mit der erwarteten Auszahlung 49,0808.
Interessant ist das Ergebnis beim Dilemma mit den Parametern 180, 300, 5: beste Wahl 290, erwartete Auszahlung 235,413.
Als Folge spieltheoretischer Überlegungen zum so genannten Urlauberdilemma glaubt der Autor ein "ungelöstes Problem" menschlichen Verhaltens entdeckt zu haben, das er als "die Idee eines Verhaltens, das aus rationaler Ablehnung rationalen Verhaltens entsteht" umschreibt. Gemeint ist die statistisch gesicherte Beobachtung, dass sich Menschen bei Entscheidungen mehrheitlich nicht nach einer von der Spieltheorie angenommenen Logik verhalten, die von Theorie und Autor willkürlich als "rational" bezeichnet wird. Diese "rationale Logik" beruht auf der Annahme, dass beide Spieler ihre jeweilige Entscheidung ausschließlich davon abhängig machen, ob der Vorteil, den sie selbst erzielen können, denjenigen des anderen übertrifft. Unter dieser Annahme ist das Nash-Gleichgewicht die logische Folge. Allerdings ist ein solches, durch Neid motiviertes Verhalten eher emotional als rational zu bezeichnen. Rational verhält sich dagegen ein Spieler, wenn er Verluste vermeidet und mögliche Gewinne optimiert. Im Falle des Urlauberdilemmas folgt daher zunächst für beide Spieler, nicht unter den Einsatz von 5 Euro zu gehen. Für alle höheren Bewertungen (> 7 Euro, da ein Malus von 2 Euro besteht) können dann beide nur noch Gewinne (wenn auch leicht unterschiedliche) einstreichen, die bei 100 Euro optimiert werden. Bei rationalem Verhalten werden beide Spieler also stets den höchsten Betrag notieren. Ein "ungelöstes Problem" ist nicht zu erkennen. Beim Gefangenendilemma ist der Konflikt insofern anders gelagert, als "Gewinne" hier nicht gemeinsam, sondern nur über "Verluste" zu Lasten des anderen Komplizen gemacht werden können.
Stellungnahme der Redaktion
Nein, nach den theoretischen Vorgaben sind sowohl im Urlauber- als auch im Gefangenendilemma die Spieler "neidlos". Es geht ihnen ausschließlich um ihren eigenen Vorteil, nicht darum, besser abzuschneiden als der andere.
Auch im Gefangenendilemma können die Beteiligten gemeinsam "Gewinne" machen, nämlich indem sie beide schweigen (kooperieren). Die Kooperation im Gefangenendilemma scheitert nicht etwa daran, dass der eine dem anderen eins auswischen will, sondern daran, dass er sich für seine Person einen größeren Vorteil erhofft (und diese Hoffnung enttäuscht wird).
Das Nash-Gleichgewicht ist hier nicht ausschlaggebend. Wenn man stattdessen ausrechnet, wie der Erwartungswert der Auszahlung ist, wenn die Wahl des Mitreisenden nicht geraten werden kann (also eine Gleichverteilung), ergibt sich ein Maximum in den hohen 90er Werten, d. h. diese Wahl ist optimal. Wenn Annahmen über die Handlungen des Mitreisenden zugrundegelegt werden, verschiebt sich dieses Maximum natürlich, aber sicherlich nicht zu niedrigeren Werten. Interessanterweise ist die Lage des Maximums von der Höhe der Bonuszahlung abhängig, was die Ergebnisse der Universität von Virginia immerhin teilweise erklärt. Die Probanden maximieren also ihre Gewinnerwartung und verhalten sich durchaus rational im Sinne der Spieltheorie.
Es klingt hier schon mehrfach in der Diskussion an. Der prozentuale Gewinn der Auszahlung bei nicht kooperativem Verhalten ist in jedem Fall geringer als der prozentuale Verlust. Im speziellen Fall kommt noch die Motivation dazu, dass ich mich durch die "unfairen" Regeln "erst recht" am "cleveren" Sachbearbeiter als Vertreter der Versicherung "rächen" will. Wenn ich 100 wähle und mein Mitspieler ähnlich durch die Bedingungen beleidigt ist, wird er auch 100 wählen, weil wir beide gegen die Versicherung spielen. Sobald ich von der 100 abweiche, bin ich meinem Mitspieler gegenüber gehässig. Wieviel ist mir also mein soziales Ansehen wert – 2 Euro?
Im Falle des Urlauberdilemmas wird sicher kein Mensch auf die Idee kommen, eine Preisangabe für die Vasen zu machen, die vorhersehbar dazu führt, dass er den kleinsten möglichen Schadensersatzbetrag bekommt. Im Gegenteil, es werden immer beide einen hohen Betrag angeben, weil sie auch nur so einen hohen Betrag von der Versicherung bekommen können. Das ist so simpel, dass man es sich kaum getraut hinzuschreiben, und ich kann beim besten Willen nicht erkennen, was an diesem Verhalten irrational sein soll. Wenn die Spieltheorie zu dem Ergebnis führt, es sei rational, das Vernünftigste und das Logischste, das Gegenteil zu tun und den kleinsten Betrag anzugeben, dann ist die Spieltheorie hier nicht anwendbar, oder sie ist selbst in höchstem Grade irrational und unlogisch. Ich würde es noch schärfer formulieren und eine solche Theorie sogar als unsinnig bezeichnen. Die Anwendung des Nash-Gleichgewicht ist hier völlig verfehlt, denn dieses Gleichgewicht ist eben nicht die Lösung derjenigen Optimierungsaufgabe, um die es hier beiden Betroffenen einzig geht, nämlich darum, die Wahrscheinlichkeit für einen hohen Auszahlungsbetrag zu maximieren.
Vielen Dank für diesen interessanten Artikel, der sehr gut aufzeigt, wie weit in diesem Bereich Theorie und Praxis oft voneinander entfernt sind!
Die Spieltheorie begeht den Fehler schon in einer Grundannahme, nämlich indem unterstellt wird, die beiden Urlauber spielten gegeneinander. Vielmehr wäre in dieser Situation das natürliche Verhalten, dass beide gegen den Dritten, also den Sachbearbeiter spielen. Verändert man diese Grundannahme, so fällt dadurch die Rückwärtsinduktion weg, da es ja nicht das Ziel ist, gegen den anderen Urlauber zu gewinnen. Daraus folgt, dass beide auf 100 setzen, gegen den Sachbearbeiter gewinnen und zugleich den besten Gewinn für beide erzielen. Doch selbst wenn man die Grundannahme beibehält – die Urlauber spielen gegeneinander –, gibt es eine Erklärung dafür, dass die Mehrheit sich für 100 entscheidet. Komischerweise wird in diesem Beispiel der ansonsten bei den Ökonomen so beliebte homo oeconomicus teilweise ausgeblendet. Dieses Modell besagt ja, dass der Einzelne – rational denkende – bestrebt ist, seinen persönlichen Nutzen (in diesem Fall Gewinn) zu maximieren. Rein intuitiv werden die meisten Menschen deshalb sofort auf 100 setzten (zweifellos kommt hier auch der von Prof. Basu erwähnte Altruismus zum Tragen). Sind jetzt die beiden Urlauber zufälligerweise Spieltheoretiker – aber auch Gewinnmaximierer –, so gibt es meiner Meinung nach trotzdem nur zwei mögliche rationale Ergebnisse: 99 und 100 – wobei 100 die risikoaverse Variante darstellt.
Der größte Gewinn in diesem Spiel kann mit 99 erzielt werden, nämlich 101. Allerdings birgt diese Strategie auch das Risiko, nur 99 zu bekommen, dem ich mit 100 entgehen könnte. Das Risiko von 98 oder weniger zu tragen zahlt sich für keinen der beiden aus, da sie ja dadurch höchstens 100 gewinnen könnten, aber das Risiko eines geringeren Betrages in Kauf nehmen müssten. Die Rückwärtsinduktion wird bei Nutzenmaximierern also bei 99 gestoppt – vor allem, wenn die beiden Spieltheoretiker das Ende der Schleife kennen. Das Setzen auf 100 stellt damit auch hier die beste und sicherste Variante dar, und niemand, der nicht Feind seiner eigenen Brieftasche ist, wird auf 2 setzen, nur um zu beweisen, dass sie/ er die Spieltheorie verstanden hat!
Stellungnahme der Redaktion
Ein Missverständnis ist hier zu klären: Die beiden Spieler des Urlauberdilemmas spielen nicht gegeneinander in dem Sinne, dass es ihnen darauf ankäme, möglichst viel mehr einzuheimsen als der andere. Dann wäre die Zielfunktion "meine Auszahlung minus deine Auszahlung". Die Zielfunktion in Basus Modell ist aber "meine Auszahlung" und nichts weiter.
Herrn Jellys Modell "Die Spieler spielen miteinander gegen den Sachbearbeiter" entspräche der altruistischen Zielfunktion "meine Auszahlung plus deine Auszahlung".
Wenn ich jeweils das Spektrum lese, ziehe ich die Brille aus, denn als Kurzsichtiger liest es sich besser ohne. Dabei ist mir ein unerklärliches Phänomen aufgefallen: wenn ich ein Auge schliesse, wächst das Erscheinungsbild des Textes auf etwa doppelte Grösse an. Sobald ich das zweite Auge dazu öffne, kehrt das Schriftbild zu seiner Normalgrösse zurück. Das Phänomen ist für mich unabhängig davon, ob ich mit dem linken oder rechten Auge lese (allerdings ist zu ergänzen, dass meine Kurzsichtigkeit relativ symmetrisch ist). Für mich ist das alles reproduzierbar. Es hört sich fast so an, als ob sich bei mir beim Schliessen eines Auges ein digitaler Zoomeffekt einstellen würde, für mich eine optische Täuschung mit einem starken Hinweis darauf, dass optische Täuschungen ihre Ursache auch im Zusammenspiel beider Augen haben können.
Diese Selbstbeobachtung hat mich dazu veranlasst, die Ehrensteinfiguren in der Augustausgabe des Spektrums auch mit einem Auge allein zu betrachten. Während die beschriebenen Phänomene in der Zweiaugenbetrachtung eindeutig nachzuvollziehen waren, scheinen sie mir in der brillenlosen Einaugenbetrachtung kaum mehr nachvollziehbar zu sein. Selbst die Aussage von Edgar Rubin, wonach die Grenze zur Figur gehöre und nicht zum Hintergrund, waren für mich mit einer einäugigen Betrachtungsweise nicht mehr gesichert.
Es ist klar, optische Täuschungen werden nicht von allen Beobachtern gleich wahrgenommen. Ob meine Beobachtungen sich durch andere Leute bestätigen liessen, müsste man erst ergründen.
Sollte die Beobachtung aber mehr als eine Selbsttäuschung sein, dann würde sie darauf hinweisen, dass in der Informationsverarbeitung und damit auch in den Phänomenen der optischen Täuschungen das Zusammenwirken der beiden Augen ein wesentlicher Faktor ist. Meine Beobachtung würde darauf hindeuten, dass die funktionsorientierte Wahrnehmung grossenteils erst durch dieses Zusammenwirken ermöglicht wird. Den Begriff funktionsorientiert wähle ich deshalb, weil in der Ehrenstein-Figur die schwarzen Linien doch durch die Wahrnehmung eigentlich zu einem Stern geformt werden, der im Zentrum von einem weissen Flecken abgedeckt wird.
04.08.2007, Dr. Rudolf Winkel, Heidelberger Str.95, 69190 Walldorf
Sind die beiden Urlauber, die nach den vom Versicherungssachbearbeiter gestellten Spielregeln nicht zum einzig logischen Ergebnis kommen, "irrational" und nicht konsequent genug? Oder zu spontan und emotional? Oder schlicht dumm?
Oder ist die Spieltheorie mit ihren Gleichgewichtsdefinitionen als Theorie noch nicht ausgereift genug, um die Wirklichkeit der Wirtschaft und die experimentellen Befunde zu erklären?
Weder noch.
Die beiden Urlauber nehmen sich einfach die Freiheit, sich nicht gegeneinander ausspielen zu lassen. Sie konkurrieren nicht gegeneinander, sondern kooperieren gegen das "System". So stellen sie sich auch gar nicht erst die Fragen, die in letzter Konsequenz zu Ende gedacht zu dem für beide bitteren Ergebnis des Nash-Gleichgewichts führen.
Sie spielen nicht mit - und das kann auch sehr rational sein.
Mein erster Gedanke beim Lesen des Artikels war spontan: "Was interessieren mich die lausigen zwei Euro? Es ist reine Zeit- und Energieverschwendung und somit völlig unwirtschaftlich (=irrational), mir darüber den Kopf zu zerbrechen."
These: Spieltheorie führt doch zum Ziel. Es ist alles eine Frage der Wertmaßstäbe.
Betrachten wir zunächst einmal das Problem ohne die Bedingung der Strafzahlung: Jeder Spieler wählt nun den maximalen Betrag von 100, da sich durch Reduzierung die Auszahlung unter keinen Umständen verbessern lässt.
Führen wir nun die Strafgebühr ein, sind zwei Fälle zu unterscheiden:
A) die Strafgebühr ist gering und tangiert mich unter Berücksichtigung des möglichen Gewinnes subjektiv nicht: Hier wird die Nebenbedingung außer Acht gelassen (sprich: die Strafgebühr hat den Wert 0) und die optimale Strategie bleibt der maximale Auszahlungsbetrag, 100.
B) die Strafgebühr ist hoch, z. B. 50, und der Verlust täte mir weh: Die Nebenbedingung kann nun nicht mehr vernachlässigt werden und die optimale Strategie ist der minimale Auszahlungsbetrag, 50.
Diese beiden Strategien in Abhängigkeit von der Höhe der Strafzahlung treten deutlich in den angeführten Studien hervor.
Stellungnahme der Redaktion
Das ist eine weitere Eigenschaft des fiktiven "rationalen Nutzenmaximierers", den sich die klassische Spieltheorie vorstellt: Denken kostet ihn nichts. Manche Marktmodelle beziehen zwar Kosten der Informationsbeschaffung ein; aber die Kosten der Informationsverarbeitung werden in der Regel nicht berücksichtigt.
Die nächste schwierige Frage folgt gleich auf dem Fuße: Wenn ich „Rundungsfehler“ akzeptiere und eine Strafgebühr von 2 gleich null setze, damit es einfacher zu denken ist, wo ist dann die Bagatellgrenze? Wovon hängt es ab, ob ich so eine nervige Gebühr ignoriere oder für voll nehme?
Im Grunde scheinen die drei Lösungsvorschläge von M. Krupp, Torsten Schöning und mein eigener keine Antworten der klassischen Spieltheorie zu sein. Alle "überziehen" die Strategien mit einer Wahrscheinleichkeitsverteilung. T. Schöning und ich verwenden die Gleichverteilung, weil analytisch lösbar und anschaulich diskutierbar, und M. Krupp verallgemeinert die gerade genannten Ansätze, indem er eine dem Problem angepasste Verteilung nutzt. Er wird einem mit der Spieltheorie vertrauten Mitspieler sicher eine andere Verteilung zuweisen als einem "Laien". Die bestangepasste Verteilung zu finden, ist vielleicht gerade des Problem einer erweiterten Spieltheorie. Klar ist auch, dass ich nicht 100 mal nach China fliegen kann, um dann mit 100 zerschlagenen Mingvasen das Spiel zu testen. Auch haben Sie (Christoph Pöppe) Recht, dass ich die Gleichverteilung nicht begründen kann, höchstens mit einer Anleihe bei der statistischen Physik, die das Prinzip maximaler Unbestimmtheit, bei dem die Gleichverteilung zu maximaler Entropie führt, erfolgreich anwendet. Vielleicht ist dies aber auch nicht zu weit hergeholt, denn in Ihrem Artikel "Die Quadratwurzel, das Irrationale und der Tod" betrachtet ja ein statistischer Physiker die Wähler auch als "Spingas".
Ein interessanter Artikel mit „eigentlich“ einfacher Lösung – nur nicht für Spieltheoretiker. Ziel: Ich möchte nicht mehr Gewinn als mein Mitspieler (klassische Spieltheorie), sondern meinen Gewinn maximieren, gleich was mein Mitspieler gewinnt. Annahme: Ich kenne nicht die Strategie meines Mitspielers und nehme an, dass jede Wahl (von 2 bis 100) gleichwahrscheinlich ist. Weiter setze ich voraus, dass der minimale Strategiewert (hier 2) immer gleich der Höhe der Belohnung/Bestrafung ist. Dann berechne ich für jede meiner Strategien x den Erwartungswert aus den Werten der entsprechenden Spalte der Auszahlungsmatrix. (Dies tut auch mein Mitspieler mit den entsprechenden Zeilen). Das reduziert die Auszahlungsmatrix auf zwei (wegen der Symmetrie des Problems) gleiche Auszahlungsvektoren, deren Werte durch folgende Auszahlungsfunktion berechenbar sind:
M bezeichne den Wert der maximalen Strategie (100) und m den der minimalen Strategie (2), der nach Voraussetzung gleich dem Wert der Belohnung/Bestrafung ist, x sei meine Strategie und A(x) der zu erwartende Auszahlungswert bei gewählter Strategie x. Diese Funktion hat genau ein Maximum bei max=M-2m+1/2, was die zweite Ableitung (bei stetig gedachtem x) bestätigt. Dass im konkreten Fall zwei benachbarte Maxima existieren, ist der Ganzzahligkeit der Aufgabenstellung geschuldet. „Bläst“ man die beiden Auszahlungsvektoren zu einer entsprechenden Auszahlungsmatrix auf, so ist das Paar (M-2m+1/2 ; M-2m+1/2) ein Nash-Gleichgewicht. Wächst m, so wandert das Gleichgewicht nach „links oben“ und wird für m=M/3 gleich dem „klassischen“ spieltheoretischen Nash-Gleichgewicht. Diese einfache Betrachtung löst – nach meiner Ansicht – die im Artikel genannten Probleme. Die Menschen handeln vernünftig oder rational, wenn sie wegen ihrer Unkenntnis einfach schätzen. Und die Menschen schätzen gut, wie die Versuche zeigen, selbst Spieltheoretiker.
Stellungnahme der Redaktion
Bei Unkenntnis der Situation schließen Statistiker gerne auf Gleichverteilung – ein legitimes Verfahren, das in diesem Fall allerdings nur schwer zu rechtfertigen ist: Ich weiß ja, dass mein Partner ebenfalls gierig ist und daher höhere Werte bevorzugen müsste.
Bemerkenswerterweise scheint es auf die Gleichverteilungsannahme nicht besonders anzukommen: In seinem (zweiten) Leserbrief kommt Martin Rupp mit einem deutlich anderen Verfahren zum selben Ergebnis: 96 oder 97.
Etwas verspätet schließe ich mich der hoffentlich noch andauernden Flut an Leserbriefen an, die gegen die Einstellung der Preisrätselrubrik protestieren – mir ist erst jetzt bewusst geworden, dass eine monatliche Institution zu Ende gehen soll. Für mich als mathematisch ungebildeten Hobbyprogrammierer waren die meisten der Rätsel mit einer idealen Mischung aus Nachdenken und Computerpower lösbar. Nicht selten habe ich am Kiosk zuerst zum Preisrätsel geschaut und mich danach zum Kauf entschieden (das müsste doch wirken). Von der Dramaturgie ist ein Preisrätsel – auch wenn es keine Millionen-Euro-Frage gibt – doch etwas ganz anderes als eine Denksportaufgabe mit gleich zugänglicher Lösung. Und außerdem – wenn die Beteiligung wirklich so niedrig war, warum habe ich dann nie gewonnen?
Der Artikel über das Urlauberdilemma erinnert mich an die Paradoxie der unerwarteten Hinrichtung: "Einem Gefangenen wird mitgeteilt, er werde nächste Woche hingerichtet. Allerdings werde der Termin für ihn eine Überraschung sein. Nun überlegt er sich: Wenn ich am Samstag abend noch lebe, muss ich am Sonntag hingerichtet werden, was aber keine Überraschung wäre. Also fällt der Sonntag als Hinrichtungsdatum weg. Dann weiß ich aber am Freitag abend, wenn ich noch lebe, dass ich am Samstag hingerichtet werde - ebenfalls keine Überraschung usw., ich kann also überhaupt nicht hingerichtet werden! Am Mittwoch taucht, unerwartet, der Henker zur Hinrichtung auf." (http://de.wikipedia.org/wiki/Paradoxon_der_unerwarteten_Hinrichtung) Diese Paradoxie zeigt, dass Rückwärtsinduktion zu Fehlschlüssen führen kann.
Geht man nicht von einem "rückwärts induzierenden" Mitspieler aus, sondern postuliert, dass er unvorhersagbar / zufällig handelt, so erhält man bei den im Artikel verwendeten Bedingungen (Einsätze 2 bis 100 Euro, 2 Euro Strafe) folgende Ergebnisse: Am günstigen sind Einsätze von 97 oder 96 Euro, mit denen man im Durchschnitt 49,08 € als Ergebnis erzielen kann; bei Einsätzen von 93 bis 100 Euro erreicht man noch über 49 €; für kleinere Einsätze nimmt das Ergebnis kontinuierlich ab, so dass man bei 2 Euro Einsatz durchschnittlich nur 3,98 € bekommt.
Mit höheren Strafen verschiebt sich das Maximum zu immer niedrigeren Einsätzen.
Man kann auch eine Formel für das Ergebnis herleiten: Mein Einsatz sei n, die Strafe sei s. Dann bekomme ich in (100–n) Fällen, also immer wenn mein Mitspieler mehr bietet, n+s € ausgezahlt. In einem Fall (der Mitspieler bietet genauso viel) bekomme ich n €. In den verbleibenden (n–2) Fällen bekomme ich immer den Einsatz k des Mitspielers abzüglich 2 Euro ausgezahlt. Summation über k (arithmetische Reihe) ergibt für diese Fälle (n–2)/2*(n–1–s). Gemittelt über alle 99 möglichen Einsätze des Mitspielers erhält man also das Ergebnis Es(n) = 1/99 * [ (100–n)*(n+s) + 1*n + (n–2)/2*(n–1–s)].
Diese Überlegungen führen für mich zu zwei Resultaten: Hohe Einsätze können doch logisch sein. Und wenn die Vasen wirklich nur 5 Euro gekostet haben, bringen hohe Strafen eher die Wahrheit ans Licht.
Stellungnahme der Redaktion
Rückwärtsinduktion ist und bleibt, wie die gewöhnliche Induktion, ein zulässiges Schlussmittel der Mathematik. Wenn ein Kettenglied unter allen Umständen wahr ist, hält die ganze Kette, und wenn sie aus noch so vielen Gliedern besteht.
Offensichtlich sind die Glieder der hier zur Debatte stehenden Kette zwar stark, aber nicht so unfehlbar stark, dass eine lange Kette nicht schwach sein, das heißt Unsinn produzieren, könnte.
Ich traute meinen Augen nicht, als ich las, was Spieltheoretiker für rationales Verhalten halten. Selbst die einzig richtige Entscheidung wird vom Autor als rational nicht nachvollziehbar, wenn auch offensichtlich richtig, angesehen, und er weiß selber nicht, wie er sich optimal in einer solchen Test-Situation verhalten soll.
Hier meine spontanen und laut Autor wohl irrationalen Gedankengänge:
1. Ich gehe von der Prämisse aus, dass der Mitspieler genauso rational und an Gewinnmaximierung interessiert ist wie ich und daher denselben Gedankengängen folgen wird und sich genauso entscheiden wird wie ich.
2. Der unter dieser Prämisse maximale Gewinn ist 100 Euro, wenn beide 100 Euro angeben. Alles andere endet in ergebnislosen Endlos-Schleifen.
Oder in der Langform:
1. Prämisse wie oben
2. Der höchstmögliche Gewinn ist 101 Euro, den man aber nur dann erreicht, wenn der eine 100 und der andere 99 wählt.
3. 98 oder weniger zu wählen ist völliger Unsinn, da damit höchstens 100 Euro Gewinn erreicht werden könnten. Das Maximum von 101 ist also unerreichbar geworden. Das Ganze birgt aber das Risiko, dass der Mitspieler sich gleich mir verhält und man so beliebig weit vom Maximum entfernt landen kann, indem man sich gegenseitig unterbietet.
4. Es ergibt sich also eine Endlosschleife zwischen 99 und 100. 1. Fall: 99 / 100 Ergebnis: 101/98 2. Fall: 99 / 99 Ergebnis: 99/99 3. Fall: 100 / 100 Ergebnis: 100/100 4. Fall: 100 / 99 Ergebnis: 98/101 Wählt der erste Spieler 99, dann hat er also einen durchschnittlichen Gewinn von 100. Wählt er 100 hat er einen durchschnittlichen Gewinn von 99. Daher wäre 99 die optimale Wahl.
5. Zu diesem Schluss muss der Mitspieler aber auch kommen. Und er erkennt, dass er jetzt nur noch die Möglichkeit hat, 98 Euro anzugeben, um mehr herauszuschlagen. Und schon hängen er und sein Mitspieler in der im Artikel beschriebenen Abwärtsspirale, die einen aber vom Ziel des maximalen Gewinns immer weiter weg führt und daher völlig unzweckmäßig ist. Das erkennt jeder (es sei denn, er ist Spieltheoretiker).
6. Man erkennt daraus, dass sich alle Beteiligten stillschweigend kollegial verhalten müssen, um wenigstens die 100 Euro einzustreichen. Dies geschieht ohne eigenen Nachteil, da auch vorher der durchschnittliche Gewinn bei lediglich 100 Euro lag, wenn man 99 Euro angegeben hat (Punkt 4). Auch wenn man wie in Punkt 5 beschrieben 98 Euro angeben würde, hätte man keinen Vorteil gegenüber der 100 Euro-Angabe.
7. Daher ist die optimale Antwort die Angabe von 100 Euro. (Und wenn sie es nicht ist, dann ist der Fehler der kleinst mögliche.)
(8. Wenn das aber so ist, dann kommt man mit der Angabe von 99 Euro doch noch etwas weiter ... aber ist dann auch noch der mögliche Fehler minimal?)
Bestärkend kommt noch eine Faustregel oder Strategie hinzu: Wenn der Mitspieler weniger angeben sollte als ich, dann setzt er das Limit, nicht ich. Hätte ich noch weniger als er angegeben, dann wäre es sehr wahrscheinlich, dass ich dann am Ende immer noch schlechter dagestanden hätte, als wenn ich sein Limit nicht unterboten hätte.
Auch hier gilt: Verfolgen beide diese Strategie, werden beide wieder bei 100 Euro landen.
Insgesamt erkenne ich, wie anscheinend über 55% aller Menschen, nicht, wo da ein Dilemma sein soll. Als irrational kann ich so ein Verhalten auch nicht bezeichnen, wie ich hoffentlich weiter oben klarmachen konnte.
Es ist bezeichnend für die "Rationalität" von Spieltheoretikern, wenn sie selbst nicht mal in der Lage sind, das optimale Verhalten zu erkennen, selbst wenn sie es nicht mathematisch formulieren können. Jedenfalls sind die im Artikel genannten Hyphothesen über die "irrationalen" Entscheidungsursachen dermaßen abstrus bis arrogant, während sie ihre 2 Euro-Theorie als einzige rational nachvollziehbare Lösung ansehen, dass die Spieltheorie und ihre Vertreter in meinen Augen massiv an Ansehen und Glaubwürdigkeit verloren haben.
Stellungnahme der Redaktion
Vorsicht beim Gebrauch des Wortes "rational"!
Die Spieltheoretiker (und die Ökonomen) haben zuerst ein Modell eines sich vernünftig verhaltenden Menschen aufgestellt. Dieses Verhalten nannten sie "rational" und präzisierten ihr Modell, indem sie ihrem gedachten Menschen eine Reihe von Eigenschaften zuschrieben: nur am eigenen Nutzen interessiert, "gefühllos", insbesondere weder altruistisch (am Wohlergehen von seinesgleichen interessiert) noch missgünstig, und fähig, alle Handlungsmöglichkeiten bis ins Letzte durchzudenken. Nicht nur das: Bei diesem Durchdenken folgt er unweigerlich – durch seine Eigenschaften diktiert – einem gewissen Denkschema. Diesen Modellmenschen nannten sie weiterhin "rational".
Jetzt kommt Herr Basu und zeigt, dass die so definierten Modellmenschen sich in einer speziellen Situation, nämlich dem Urlauberdilemma, sehr unvernünftig verhalten. Also sind auf einmal "rational" im Sinne der Umgangssprache, "rational" im Sinne der Interessen des Modellmenschen und "rational" im Sinne seiner Handlungen drei verschiedene Dinge, die sämtlich mit demselben Wort bezeichnet werden.
Natürlich ist es reizvoll, mit dieser Mehrdeutigkeit zu spielen; das tut Basu auch mehrfach in seinem Artikel. Daraus zu schließen, die Spieltheoretiker seien unfähig, die verschiedenen Arten von Rationalität zu unterscheiden, halte ich für etwas voreilig.
Irrationale Spieltheoretiker (Ergänzung)
09.08.2007, Berthold Hövel, OverathDas Problem ist hier nicht der Begriff der Rationalität, sondern der Algorithmus, der diese Rationalität abbilden soll. Hier versagt die Spieltheorie vollständig. Das wollte der Autor mit seinem Artikel ja auch aufzeigen. Er zieht hier nur völlig falsche Schlüsse, weil er den Begriff der Rationalität selbst als gefährdet ansieht und nicht nur dessen algorithmische Abbildung.
(Zitat: "Die Tatsache, dass das Nash-Gleichgewicht [als Versuchsergebnis] nicht vorkommt, zeigt wiederum, dass der Mensch nicht rational entscheidet - oder vielmehr, dass die übliche Vorstellung von rationalem Verhalten revisionsbedürftig ist.")
Dass dies wirklich so ist und der Autor nicht nur mit der Mehrdeutigkeit des Begriffes der Rationalität spielt, wie Herr Pöppe in seiner Antwort unterstellt, zeigt die Passage, in der der Autor seine eigenen Gedanken in einem Urlauber-Dilemma beschreibt. (Zitat: "Zum Kuckuck mit der Spieltheorie. Ich spiele einfach eine hohe Zahl, sagen wir 95") Hier zeigt sich, dass er völlig den Faden verloren hat und in seiner Hilflosigkeit völlig irrational handeln würde. Die ansonsten für die Mehrheit der Menschen offensichtliche (im Sinne der Spieltheorie) rationale Lösung ist er nicht mehr in der Lage zu erkennen.
In dieser Ratlosigkeit kommt es dann unter anderem zur unfassbaren und empörenden Unterstellung, dass sich viele Menschen aus Dummheit einfach für die optimale Lösung entscheiden. Ich kann da nur sagen, wer mit dem Finger auf andere zeigt, bei dem zeigen vier Finger auf einen selbst. (Zitat: "... die naheliegende[!] Theorie von der Trägheit des Geistes. Viele Spieler seien schlichtweg nicht fähig oder willens, die gedanklichen Schritte hin zum Nash-Gleichgewicht zu vollziehen, weswegen ihre Entscheidung unweigerlich irrational ausfalle") Na, darüber sollte die Menschheit wirklich froh sein!!! (Falls diese Worte nicht vom Autor selbst stammen, sondern von Herrn Rubinstein, dessen Untersuchungsergebnisse der Autor an dieser Stelle analysiert, hat der Autor dennoch versäumt dies entsprechend kenntlich zu machen und sich dann davon zu distanzieren)
Aber auch hier zeigt sich erneut deutlich die Unfähigkeit, zwischen Rationalität und deren algorithmischen Abbildung zu unterscheiden. Für einen Wissenschaftler ein wirklich blamabler Fehler. Anscheinend ist davon aber nicht nur der Autor, sondern die ganze Zunft der Spieltheoretiker betroffen.
Ich denke, ich habe in meinem ersten Leserbrief aufzeigen können, dass es eine halbwegs saubere algorithmische Lösung des Problems gibt, die der Prämisse der Rationalität aus der Spieltheorie exakt entspricht und zum Optimum (100,100) führt. Ich bin kein Mathematiker, sondern Informatiker. Mir reicht das als Beweis, dass es hier nicht um eine Krise des Rationalitätsbegriffes der Spieltheorie selbst geht, sondern lediglich um ein algorithmisches. Die Suche nach dem Nash-Gleichgewicht als Lösungsstrategie ist offensichtlich (und wahrscheinlich auch grundsätzlich) ein falscher Ansatz und muss durch eine andere Ermittlung der Gewinnmaximierung ersetzt werden. Das ist alles.
Sämtliche Folgerungen, die der Autor aus dieser vermeintlichen Krise zieht, haben also keine Grundlage und sind daher wertlos. Viel bleibt dann jedoch nicht mehr vom Artikel übrig.
Erwartungswert vs. Singuläre Bewertungen?
08.08.2007, mario semo, WienNur: Sie können es niemals "wirklich".
In meinem Sinn wäre die Strategie der Wahl beim ursprünglichen Urlauberdilemma mit den Parametern (2, 100, 2) gleich 96 und bei dem Problem mit (180, 300, 5) gleich 290. Und Menschen tippen meist knapp daneben.
Ein Beispiel zu dem Vorgehen:
Ich wähle 100. Der Partner kann die Werte 2, 3, 4, …,99, 100 wählen, was für mich die Auszahlungen 0, 1, 2, …97, 100 ergibt. Wenn ich jeder Wahl des Partners die gleiche Wahrscheinlichkeit zuweise (die dann 1/99 ist), ergibt sich für meine Auszahlung der Erwartungswert
(1/99 )* (0+1+2+...+97+100) = 49,0202
Nun maximiere ich das über alle möglichen Wahlen meines eigenes Wertes und bekomme:
Die beste Wahl ist 96 mit der erwarteten Auszahlung 49,0808.
Interessant ist das Ergebnis beim Dilemma mit den Parametern 180, 300, 5:
beste Wahl 290, erwartete Auszahlung 235,413.
Ich habe ein Computerprogramm in C geschrieben, mit dessen Hilfe man die Erwartungsfunktion berechnen kann. Es kann unter
http://members.hostprofis.at/semo/Spektrum/UrlauberDil.cpp
heruntergeladen werden.
Spiel mit Begriffen
08.08.2007, Dr. Armin Tippe, SchwabhausenDiese "rationale Logik" beruht auf der Annahme, dass beide Spieler ihre jeweilige Entscheidung ausschließlich davon abhängig machen, ob der Vorteil, den sie selbst erzielen können, denjenigen des anderen übertrifft. Unter dieser Annahme ist das Nash-Gleichgewicht die logische Folge. Allerdings ist ein solches, durch Neid motiviertes Verhalten eher emotional als rational zu bezeichnen.
Rational verhält sich dagegen ein Spieler, wenn er Verluste vermeidet und mögliche Gewinne optimiert. Im Falle des Urlauberdilemmas folgt daher zunächst für beide Spieler, nicht unter den Einsatz von 5 Euro zu gehen. Für alle höheren Bewertungen (> 7 Euro, da ein Malus von 2 Euro besteht) können dann beide nur noch Gewinne (wenn auch leicht unterschiedliche) einstreichen, die bei 100 Euro optimiert werden. Bei rationalem Verhalten werden beide Spieler also stets den höchsten Betrag notieren. Ein "ungelöstes Problem" ist nicht zu erkennen.
Beim Gefangenendilemma ist der Konflikt insofern anders gelagert, als "Gewinne" hier nicht gemeinsam, sondern nur über "Verluste" zu Lasten des anderen Komplizen gemacht werden können.
Nein, nach den theoretischen Vorgaben sind sowohl im Urlauber- als auch im Gefangenendilemma die Spieler "neidlos". Es geht ihnen ausschließlich um ihren eigenen Vorteil, nicht darum, besser abzuschneiden als der andere.
Auch im Gefangenendilemma können die Beteiligten gemeinsam "Gewinne" machen, nämlich indem sie beide schweigen (kooperieren). Die Kooperation im Gefangenendilemma scheitert nicht etwa daran, dass der eine dem anderen eins auswischen will, sondern daran, dass er sich für seine Person einen größeren Vorteil erhofft (und diese Hoffnung enttäuscht wird).
Christoph Pöppe, Redaktion
Auf den Erwartungswert kommt es an
07.08.2007, Sylvia Smolorz, MünchenWenn man stattdessen ausrechnet, wie der Erwartungswert der Auszahlung ist, wenn die Wahl des Mitreisenden nicht geraten werden kann (also eine Gleichverteilung), ergibt sich ein Maximum in den hohen 90er Werten, d. h. diese Wahl ist optimal. Wenn Annahmen über die Handlungen des Mitreisenden zugrundegelegt werden, verschiebt sich dieses Maximum natürlich, aber sicherlich nicht zu niedrigeren Werten.
Interessanterweise ist die Lage des Maximums von der Höhe der Bonuszahlung abhängig, was die Ergebnisse der Universität von Virginia immerhin teilweise erklärt.
Die Probanden maximieren also ihre Gewinnerwartung und verhalten sich durchaus rational im Sinne der Spieltheorie.
Gib mir Prozente!
07.08.2007, Sven aus ChemnitzIm speziellen Fall kommt noch die Motivation dazu, dass ich mich durch die "unfairen" Regeln "erst recht" am "cleveren" Sachbearbeiter als Vertreter der Versicherung "rächen" will. Wenn ich 100 wähle und mein Mitspieler ähnlich durch die Bedingungen beleidigt ist, wird er auch 100 wählen, weil wir beide gegen die Versicherung spielen.
Sobald ich von der 100 abweiche, bin ich meinem Mitspieler gegenüber gehässig. Wieviel ist mir also mein soziales Ansehen wert – 2 Euro?
Was taugt dann noch die Spieltheorie?
07.08.2007, Dr. Gunter Berauer, MünchenDie Urlauber spielen nicht gegeneinander
07.08.2007, Jürgen Jelly, Wiener NeustadtDie Spieltheorie begeht den Fehler schon in einer Grundannahme, nämlich indem unterstellt wird, die beiden Urlauber spielten gegeneinander. Vielmehr wäre in dieser Situation das natürliche Verhalten, dass beide gegen den
Dritten, also den Sachbearbeiter spielen. Verändert man diese Grundannahme, so fällt dadurch die Rückwärtsinduktion weg, da es ja
nicht das Ziel ist, gegen den anderen Urlauber zu gewinnen. Daraus folgt, dass beide auf 100 setzen, gegen den Sachbearbeiter gewinnen und zugleich den besten Gewinn für beide erzielen. Doch selbst wenn man die Grundannahme beibehält – die Urlauber spielen gegeneinander –, gibt es eine Erklärung dafür, dass die Mehrheit sich für 100 entscheidet. Komischerweise wird in diesem Beispiel der ansonsten bei den Ökonomen so beliebte homo oeconomicus teilweise ausgeblendet. Dieses Modell besagt ja, dass der Einzelne – rational denkende – bestrebt ist, seinen persönlichen Nutzen (in diesem Fall Gewinn) zu maximieren. Rein intuitiv werden die meisten Menschen deshalb sofort auf 100 setzten (zweifellos kommt hier auch der von Prof. Basu erwähnte Altruismus zum Tragen). Sind jetzt die beiden Urlauber zufälligerweise Spieltheoretiker – aber auch Gewinnmaximierer –, so gibt es meiner Meinung nach trotzdem nur zwei mögliche rationale Ergebnisse: 99 und 100 – wobei 100 die risikoaverse Variante darstellt.
Der größte Gewinn in diesem Spiel kann mit 99 erzielt werden, nämlich 101. Allerdings birgt diese Strategie auch das Risiko, nur 99 zu bekommen, dem ich mit 100 entgehen könnte. Das Risiko von 98 oder weniger zu tragen zahlt sich für keinen der beiden aus, da sie ja dadurch höchstens 100 gewinnen könnten, aber das Risiko eines geringeren Betrages in Kauf nehmen müssten. Die Rückwärtsinduktion wird bei Nutzenmaximierern also bei 99 gestoppt – vor allem, wenn die beiden Spieltheoretiker das Ende der Schleife kennen. Das Setzen auf 100 stellt damit auch hier die beste und sicherste Variante dar, und niemand, der nicht Feind seiner eigenen Brieftasche ist, wird auf 2 setzen, nur um zu beweisen, dass sie/ er die Spieltheorie verstanden hat!
Ein Missverständnis ist hier zu klären: Die beiden Spieler des Urlauberdilemmas spielen nicht gegeneinander in dem Sinne, dass es ihnen darauf ankäme, möglichst viel mehr einzuheimsen als der andere. Dann wäre die Zielfunktion "meine Auszahlung minus deine Auszahlung". Die Zielfunktion in Basus Modell ist aber "meine Auszahlung" und nichts weiter.
Herrn Jellys Modell "Die Spieler spielen miteinander gegen den Sachbearbeiter" entspräche der altruistischen Zielfunktion "meine Auszahlung plus deine Auszahlung".
optische Täuschungen - mit einem Auge betrachtet
06.08.2007, Dr. Niklaus Baltzer, Biel, SchweizDiese Selbstbeobachtung hat mich dazu veranlasst, die Ehrensteinfiguren in der Augustausgabe des Spektrums auch mit einem Auge allein zu betrachten. Während die beschriebenen Phänomene in der Zweiaugenbetrachtung eindeutig nachzuvollziehen waren, scheinen sie mir in der brillenlosen Einaugenbetrachtung kaum mehr nachvollziehbar zu sein. Selbst die Aussage von Edgar Rubin, wonach die Grenze zur Figur gehöre und nicht zum Hintergrund, waren für mich mit einer einäugigen Betrachtungsweise nicht mehr gesichert.
Es ist klar, optische Täuschungen werden nicht von allen Beobachtern gleich wahrgenommen. Ob meine Beobachtungen sich durch andere Leute bestätigen liessen, müsste man erst ergründen.
Sollte die Beobachtung aber mehr als eine Selbsttäuschung sein, dann würde sie darauf hinweisen, dass in der Informationsverarbeitung und damit auch in den Phänomenen der optischen Täuschungen das Zusammenwirken der beiden Augen ein wesentlicher Faktor ist. Meine Beobachtung würde darauf hindeuten, dass die funktionsorientierte Wahrnehmung grossenteils erst durch dieses Zusammenwirken ermöglicht wird. Den Begriff funktionsorientiert wähle ich deshalb, weil in der Ehrenstein-Figur die schwarzen Linien doch durch die Wahrnehmung eigentlich zu einem Stern geformt werden, der im Zentrum von einem weissen Flecken abgedeckt wird.
Nicht mitspielen kann auch rational sein
04.08.2007, Dr. Rudolf Winkel, Heidelberger Str.95, 69190 WalldorfOder ist die Spieltheorie mit ihren Gleichgewichtsdefinitionen als Theorie noch nicht ausgereift genug, um die Wirklichkeit der Wirtschaft und die experimentellen Befunde zu erklären?
Weder noch.
Die beiden Urlauber nehmen sich einfach die Freiheit, sich nicht gegeneinander ausspielen zu lassen. Sie konkurrieren nicht gegeneinander, sondern kooperieren gegen das "System". So stellen sie sich auch gar nicht erst die Fragen, die in letzter Konsequenz zu Ende gedacht zu dem für beide bitteren Ergebnis des Nash-Gleichgewichts führen.
Sie spielen nicht mit - und das kann auch sehr rational sein.
Subjektive Bewertung der Strafe
03.08.2007, Maik Sonnenberg, DüsseldorfThese: Spieltheorie führt doch zum Ziel. Es ist alles eine Frage der Wertmaßstäbe.
Betrachten wir zunächst einmal das Problem ohne die Bedingung der Strafzahlung:
Jeder Spieler wählt nun den maximalen Betrag von 100, da sich durch Reduzierung die Auszahlung unter keinen Umständen verbessern lässt.
Führen wir nun die Strafgebühr ein, sind zwei Fälle zu unterscheiden:
A) die Strafgebühr ist gering und tangiert mich unter Berücksichtigung des möglichen Gewinnes subjektiv nicht:
Hier wird die Nebenbedingung außer Acht gelassen (sprich: die Strafgebühr hat den Wert 0) und die optimale Strategie bleibt der maximale Auszahlungsbetrag, 100.
B) die Strafgebühr ist hoch, z. B. 50, und der Verlust täte mir weh:
Die Nebenbedingung kann nun nicht mehr vernachlässigt werden und die optimale Strategie ist der minimale Auszahlungsbetrag, 50.
Diese beiden Strategien in Abhängigkeit von der Höhe der Strafzahlung treten deutlich in den angeführten Studien hervor.
Das ist eine weitere Eigenschaft des fiktiven "rationalen Nutzenmaximierers", den sich die klassische Spieltheorie vorstellt: Denken kostet ihn nichts. Manche Marktmodelle beziehen zwar Kosten der Informationsbeschaffung ein; aber die Kosten der Informationsverarbeitung werden in der Regel nicht berücksichtigt.
Die nächste schwierige Frage folgt gleich auf dem Fuße: Wenn ich „Rundungsfehler“ akzeptiere und eine Strafgebühr von 2 gleich null setze, damit es einfacher zu denken ist, wo ist dann die Bagatellgrenze? Wovon hängt es ab, ob ich so eine nervige Gebühr ignoriere oder für voll nehme?
Zur Antwort auf "einfache statistische Lösung?"
03.08.2007, Wolfgang Illig, RuppertsgrünKlar ist auch, dass ich nicht 100 mal nach China fliegen kann, um dann mit 100 zerschlagenen Mingvasen das Spiel zu testen. Auch haben Sie (Christoph Pöppe) Recht, dass ich die Gleichverteilung nicht begründen kann, höchstens mit einer Anleihe bei der statistischen Physik, die das Prinzip maximaler Unbestimmtheit, bei dem die Gleichverteilung zu maximaler Entropie führt, erfolgreich anwendet. Vielleicht ist dies aber auch nicht zu weit hergeholt, denn in Ihrem Artikel "Die Quadratwurzel, das Irrationale und der Tod" betrachtet ja ein statistischer Physiker die Wähler auch als "Spingas".
einfache statistische Lösung?
03.08.2007, Wolfgang Illig, RuppertsgrünZiel: Ich möchte nicht mehr Gewinn als mein Mitspieler (klassische Spieltheorie), sondern meinen Gewinn maximieren, gleich was mein Mitspieler gewinnt.
Annahme: Ich kenne nicht die Strategie meines Mitspielers und nehme an, dass jede Wahl (von 2 bis 100) gleichwahrscheinlich ist. Weiter setze ich voraus, dass der minimale Strategiewert (hier 2) immer gleich der Höhe der Belohnung/Bestrafung ist.
Dann berechne ich für jede meiner Strategien x den Erwartungswert aus den Werten der entsprechenden Spalte der Auszahlungsmatrix. (Dies tut auch mein Mitspieler mit den entsprechenden Zeilen). Das reduziert die Auszahlungsmatrix auf zwei (wegen der Symmetrie des Problems) gleiche Auszahlungsvektoren, deren Werte durch folgende Auszahlungsfunktion berechenbar sind:
A(x) = 1/(M-m+1) [-x²/2 + (M-2m+1/2)x + (M+m/2+1/2)m].
M bezeichne den Wert der maximalen Strategie (100) und m den der minimalen Strategie (2), der nach Voraussetzung gleich dem Wert der Belohnung/Bestrafung ist, x sei meine Strategie und A(x) der zu erwartende Auszahlungswert bei gewählter Strategie x.
Diese Funktion hat genau ein Maximum bei max=M-2m+1/2, was die zweite Ableitung (bei stetig gedachtem x) bestätigt. Dass im konkreten Fall zwei benachbarte Maxima existieren, ist der Ganzzahligkeit der Aufgabenstellung geschuldet.
„Bläst“ man die beiden Auszahlungsvektoren zu einer entsprechenden Auszahlungsmatrix auf, so ist das Paar (M-2m+1/2 ; M-2m+1/2) ein Nash-Gleichgewicht. Wächst m, so wandert das Gleichgewicht nach „links oben“ und wird für m=M/3 gleich dem „klassischen“ spieltheoretischen Nash-Gleichgewicht.
Diese einfache Betrachtung löst – nach meiner Ansicht – die im Artikel genannten Probleme. Die Menschen handeln vernünftig oder rational, wenn sie wegen ihrer Unkenntnis einfach schätzen. Und die Menschen schätzen gut, wie die Versuche zeigen, selbst Spieltheoretiker.
Bei Unkenntnis der Situation schließen Statistiker gerne auf Gleichverteilung – ein legitimes Verfahren, das in diesem Fall allerdings nur schwer zu rechtfertigen ist: Ich weiß ja, dass mein Partner ebenfalls gierig ist und daher höhere Werte bevorzugen müsste.
Bemerkenswerterweise scheint es auf die Gleichverteilungsannahme nicht besonders anzukommen: In seinem (zweiten) Leserbrief kommt Martin Rupp mit einem deutlich anderen Verfahren zum selben Ergebnis: 96 oder 97.
Christoph Pöppe, Redaktion
Preisrätsel!
03.08.2007, Doppler Stefan, Schlierbach/ÖsterreichFür mich als mathematisch ungebildeten Hobbyprogrammierer waren die meisten der Rätsel mit einer idealen Mischung aus Nachdenken und Computerpower lösbar. Nicht selten habe ich am Kiosk zuerst zum Preisrätsel geschaut und mich danach zum Kauf entschieden (das müsste doch wirken).
Von der Dramaturgie ist ein Preisrätsel – auch wenn es keine Millionen-Euro-Frage gibt – doch etwas ganz anderes als eine Denksportaufgabe mit gleich zugänglicher Lösung.
Und außerdem – wenn die Beteiligung wirklich so niedrig war, warum habe ich dann nie gewonnen?
Rückwärtsinduktion kann zu Fehlschlüssen führen
01.08.2007, Torsten Schöning, Jena"Einem Gefangenen wird mitgeteilt, er werde nächste Woche hingerichtet. Allerdings werde der Termin für ihn eine Überraschung sein. Nun überlegt er sich: Wenn ich am Samstag abend noch lebe, muss ich am Sonntag hingerichtet werden, was aber keine Überraschung wäre. Also fällt der Sonntag als Hinrichtungsdatum weg.
Dann weiß ich aber am Freitag abend, wenn ich noch lebe, dass ich am Samstag hingerichtet werde - ebenfalls keine Überraschung usw., ich kann also überhaupt nicht hingerichtet werden!
Am Mittwoch taucht, unerwartet, der Henker zur Hinrichtung auf."
(http://de.wikipedia.org/wiki/Paradoxon_der_unerwarteten_Hinrichtung)
Diese Paradoxie zeigt, dass Rückwärtsinduktion zu Fehlschlüssen führen kann.
Geht man nicht von einem "rückwärts induzierenden" Mitspieler aus, sondern postuliert, dass er unvorhersagbar / zufällig handelt, so erhält man bei den im Artikel verwendeten Bedingungen (Einsätze 2 bis 100 Euro, 2 Euro Strafe) folgende Ergebnisse: Am günstigen sind Einsätze von 97 oder 96 Euro, mit denen man im Durchschnitt 49,08 € als Ergebnis erzielen kann; bei Einsätzen von 93 bis 100 Euro erreicht man noch über
49 €; für kleinere Einsätze nimmt das Ergebnis kontinuierlich ab, so dass man bei 2 Euro Einsatz durchschnittlich nur 3,98 € bekommt.
Mit höheren Strafen verschiebt sich das Maximum zu immer niedrigeren Einsätzen.
Man kann auch eine Formel für das Ergebnis herleiten: Mein Einsatz sei n, die Strafe sei s. Dann bekomme ich in (100–n) Fällen, also immer wenn mein Mitspieler mehr bietet, n+s € ausgezahlt. In einem Fall (der Mitspieler bietet genauso viel) bekomme ich n €. In den verbleibenden (n–2) Fällen bekomme ich immer den Einsatz k des Mitspielers abzüglich 2 Euro ausgezahlt. Summation über k (arithmetische Reihe) ergibt für diese Fälle (n–2)/2*(n–1–s).
Gemittelt über alle 99 möglichen Einsätze des Mitspielers erhält man also das Ergebnis Es(n) = 1/99 * [ (100–n)*(n+s) + 1*n + (n–2)/2*(n–1–s)].
Diese Überlegungen führen für mich zu zwei Resultaten: Hohe Einsätze können doch logisch sein. Und wenn die Vasen wirklich nur 5 Euro gekostet haben, bringen hohe Strafen eher die Wahrheit ans Licht.
Rückwärtsinduktion ist und bleibt, wie die gewöhnliche Induktion, ein zulässiges Schlussmittel der Mathematik. Wenn ein Kettenglied unter allen Umständen wahr ist, hält die ganze Kette, und wenn sie aus noch so vielen Gliedern besteht.
Offensichtlich sind die Glieder der hier zur Debatte stehenden Kette zwar stark, aber nicht so unfehlbar stark, dass eine lange Kette nicht schwach sein, das heißt Unsinn produzieren, könnte.
Christoph Pöppe, Redaktion
Irrationale Spieltheoretiker
31.07.2007, Berthold Hövel, OverathHier meine spontanen und laut Autor wohl irrationalen Gedankengänge:
1. Ich gehe von der Prämisse aus, dass der Mitspieler genauso rational und an Gewinnmaximierung interessiert ist wie ich und daher denselben Gedankengängen folgen wird und sich genauso entscheiden wird wie ich.
2. Der unter dieser Prämisse maximale Gewinn ist 100 Euro, wenn beide 100 Euro angeben. Alles andere endet in ergebnislosen Endlos-Schleifen.
Oder in der Langform:
1. Prämisse wie oben
2. Der höchstmögliche Gewinn ist 101 Euro, den man aber nur dann erreicht, wenn der eine 100 und der andere 99 wählt.
3. 98 oder weniger zu wählen ist völliger Unsinn, da damit höchstens 100 Euro Gewinn erreicht werden könnten. Das Maximum von 101 ist also unerreichbar geworden. Das Ganze birgt aber das Risiko, dass der Mitspieler sich gleich mir verhält und man so beliebig weit vom Maximum entfernt landen kann, indem man sich gegenseitig unterbietet.
4. Es ergibt sich also eine Endlosschleife zwischen 99 und 100.
1. Fall: 99 / 100 Ergebnis: 101/98
2. Fall: 99 / 99 Ergebnis: 99/99
3. Fall: 100 / 100 Ergebnis: 100/100
4. Fall: 100 / 99 Ergebnis: 98/101
Wählt der erste Spieler 99, dann hat er also einen durchschnittlichen Gewinn von 100. Wählt er 100 hat er einen durchschnittlichen Gewinn von 99. Daher wäre 99 die optimale Wahl.
5. Zu diesem Schluss muss der Mitspieler aber auch kommen. Und er erkennt, dass er jetzt nur noch die Möglichkeit hat, 98 Euro anzugeben, um mehr herauszuschlagen. Und schon hängen er und sein Mitspieler in der im Artikel beschriebenen Abwärtsspirale, die einen aber vom Ziel des maximalen Gewinns immer weiter weg führt und daher völlig unzweckmäßig ist. Das erkennt jeder (es sei denn, er ist Spieltheoretiker).
6. Man erkennt daraus, dass sich alle Beteiligten stillschweigend kollegial verhalten müssen, um wenigstens die 100 Euro einzustreichen. Dies geschieht ohne eigenen Nachteil, da auch vorher der durchschnittliche Gewinn bei lediglich 100 Euro lag, wenn man 99 Euro angegeben hat (Punkt 4). Auch wenn man wie in Punkt 5 beschrieben 98 Euro angeben würde, hätte man keinen Vorteil gegenüber der 100 Euro-Angabe.
7. Daher ist die optimale Antwort die Angabe von 100 Euro. (Und wenn sie es nicht ist, dann ist der Fehler der kleinst mögliche.)
(8. Wenn das aber so ist, dann kommt man mit der Angabe von 99 Euro doch noch etwas weiter ... aber ist dann auch noch der mögliche Fehler minimal?)
Bestärkend kommt noch eine Faustregel oder Strategie hinzu:
Wenn der Mitspieler weniger angeben sollte als ich, dann setzt er das Limit, nicht ich. Hätte ich noch weniger als er angegeben, dann wäre es sehr wahrscheinlich, dass ich dann am Ende immer noch schlechter dagestanden hätte, als wenn ich sein Limit nicht unterboten hätte.
Auch hier gilt: Verfolgen beide diese Strategie, werden beide wieder bei 100 Euro landen.
Insgesamt erkenne ich, wie anscheinend über 55% aller Menschen, nicht, wo da ein Dilemma sein soll. Als irrational kann ich so ein Verhalten auch nicht bezeichnen, wie ich hoffentlich weiter oben klarmachen konnte.
Es ist bezeichnend für die "Rationalität" von Spieltheoretikern, wenn sie selbst nicht mal in der Lage sind, das optimale Verhalten zu erkennen, selbst wenn sie es nicht mathematisch formulieren können. Jedenfalls sind die im Artikel genannten Hyphothesen über die "irrationalen" Entscheidungsursachen dermaßen abstrus bis arrogant, während sie ihre 2 Euro-Theorie als einzige rational nachvollziehbare Lösung ansehen, dass die Spieltheorie und ihre Vertreter in meinen Augen massiv an Ansehen und Glaubwürdigkeit verloren haben.
Vorsicht beim Gebrauch des Wortes "rational"!
Die Spieltheoretiker (und die Ökonomen) haben zuerst ein Modell eines sich vernünftig verhaltenden Menschen aufgestellt. Dieses Verhalten nannten sie "rational" und präzisierten ihr Modell, indem sie ihrem gedachten Menschen eine Reihe von Eigenschaften zuschrieben: nur am eigenen Nutzen interessiert, "gefühllos", insbesondere weder altruistisch (am Wohlergehen von seinesgleichen interessiert) noch missgünstig, und fähig, alle Handlungsmöglichkeiten bis ins Letzte durchzudenken. Nicht nur das: Bei diesem Durchdenken folgt er unweigerlich – durch seine Eigenschaften diktiert – einem gewissen Denkschema. Diesen Modellmenschen nannten sie weiterhin "rational".
Jetzt kommt Herr Basu und zeigt, dass die so definierten Modellmenschen sich in einer speziellen Situation, nämlich dem Urlauberdilemma, sehr unvernünftig verhalten. Also sind auf einmal "rational" im Sinne der Umgangssprache, "rational" im Sinne der Interessen des Modellmenschen und "rational" im Sinne seiner Handlungen drei verschiedene Dinge, die sämtlich mit demselben Wort bezeichnet werden.
Natürlich ist es reizvoll, mit dieser Mehrdeutigkeit zu spielen; das tut Basu auch mehrfach in seinem Artikel. Daraus zu schließen, die Spieltheoretiker seien unfähig, die verschiedenen Arten von Rationalität zu unterscheiden, halte ich für etwas voreilig.
Christoph Pöppe, Redaktion