Der Test
Zu Beginn des Wahrscheinlichkeits-Lehrgangs gibt Fritz Fischer seinen 40 Schülern als Hausaufgabe, eine Münze genau 10 Mal zu werfen und dann aufzuschreiben, wie oft "Zahl" gekommen ist. Am nächsten Tag fragt er, wer genau 5 Mal die Zahl bekommen hat, und es melden sich 20. "Wahrscheinlich hat ungefähr die Hälfte von denen, die sich jetzt gemeldet haben, die Hausaufgabe gar nicht gemacht oder das Ergebnis gefälscht." Wie kommt er zu dieser Anschuldigung?
Hoffentlich gehören Sie nicht zu den blutigen Laien, die erwarten, dass die meisten das Ergebnis 5/10 zu 5/10 bekommen müssten. Aber was macht ein Mensch, der die Aufgabe vergessen hat und dann vor der Stunde noch schnell das aufschreibt, was er erwartet (der Erwartungswert für das Ergebnis "Zahl" im fachsprachlichen Sinn des Wortes ist tatsächlich 1/2). Einige hatten nur 2 Mal "Zahl" und fragten sich, was sie falsch gemacht hätten.
Wir wollen uns nun ganz vorsichtig an die richtige Lösung heranschleichen:
Nach nur einem Wurf erwarten wir, dass die Hälfte "Zahl" bekommt. Von jeder dieser Hälfte wird beim 2. Wurf auch wieder die Hälfte "Zahl" bekommen. Etwa 1/4 hat nun keine Zahl, 2/4 haben eine und 1/4 zwei. Wir müssen also immer halbieren und die Leute mit gleich vielen Zahl-Würfen zusammenfassen:p=0 | . | 1 | . | |||||||||||||
p=1 | . | 1/2 | 1/2 | . | ||||||||||||
p=2 | . | 1/4 | 2/4 | 1/4 | . | |||||||||||
p=3 | . | 1/8 | 3/8 | 3/8 | 1/8 | . | ||||||||||
p=4 | . | 1/16 | 4/16 | 6/16 | 4/16 | 1/16 | . | |||||||||
p=5 | . | 1/32 | 5/32 | 10/32 | 10/32 | 5/32 | 1/32 | . | ||||||||
p=6 | . | 1/64 | 6/64 | 15/64 | 20/64 | 15/64 | 6/64 | 1/64 | . | |||||||
p=7 | 1/128 | 7/128 | 21/128 | 35/128 | 35/128 | 21/128 | 7/128 | 1/128 |
In der 10. Zeile bekommt man (wenn man noch etwas weiter rechnet oder rechnen lässt oder die Formel für die Binomial-Verteilung verwendet) in der Mitte, also für 5 Treffer bei 10 Versuchen 252/1024 heraus, das sind 24,61 %.
Bei 40 Schülern wäre daher zu erwarten gewesen, dass etwa ein Viertel von ihnen (10 Leute) 5 Zahlen werfen. Dass es stattdessen doppelt so viele sind, ist – wenn es mit rechten Dingen zugeht – eher unwahrscheinlich, wenn auch wiederum nicht ausgeschlossen. Herr Fischer konnte daher davon ausgehen, dass ungefähr 10 Leute geschummelt hatten.
Nun kann man ganz naiv fragen: Welche Zahl hätte man denn sonst statt der 5 aufschreiben sollen, wenn man das Experiment nicht ausgeführt hat? Ist denn 5 nicht das wahrscheinlichste Ergebnis? Sicher ist es das, aber das heißt nur, dass es häufiger zu erwarten ist als jedes andere einzelne, aber es heißt noch lange nicht, dass es häufiger wäre als alle anderen zusammen: Das ist es überhaupt nie!
Fisher hat gezeigt, dass der Geistliche und Hobby-Botaniker Gregor Mendel nicht nur die später sprichwörtlich gewordenen Erbsen gezählt und dabei die heute (zu Recht!) mit seinem Namen verbundenen Gesetze gefunden hat (die bei seinem Tod wieder vergessen waren), sondern nach heutigen Maßstäben dabei kräftig geschummelt hat. Wo nach seinen Regeln die relative Häufigkeit 3/4 zu erwarten ist, hat er behauptet, 75 von 100 Erbsen gezählt zu haben, und das nicht etwa als Mittelwert vieler Zählungen, sondern für Einzel-Serien.
Vermutlich läuft so etwas so ab: Wenn es 78 von 100 Stück sind (nicht herunter-gerechnet, sondern mit wirklich nur 100 Erbsen), könnte die Regel ja auch auf 4/5 hinauslaufen, aber dafür hatte er keine Theorie, wohl aber für 3/4, also hielt er Werte wie 78 oder 79 für Irrtümer (der Natur?) und 75 für den echten Wert.
Heute lernen Naturwissenschaftler (hoffentlich) wesentlich mehr über Statistik, als Mendel wusste, und können mit scheinbaren Regelabweichungen besser umgehen.
Die folgenden beiden Bilder zeigen zweimal die hier zu Grunde liegende Binomial-Verteilung, und zwar einmal in Quotienten ganzer Zahlen: Die Zähler heißen Binomial-Koeffizienten, weil sie nämlich bei der Ausrechnung des "Binoms" \((a+b)^p\) vorkommen, die Nenner sind die Potenzen von 2, links und rechts unten sind die Kästchen so klein, dass die Zahlen nicht mehr hineinpassen. Bei den ungeraden Anzahlen von Münzwürfen (Zeilennummern) kann man sich vergewissern, dass die Sache symmetrisch ist: Die Häufigkeit für "weniger als die Hälfte aller Würfe ist Zahl" (Summe aller Zähler von links bis zur Zeilenmitte) ist genau gleich der Häufigkeit für "mehr als die Hälfte ist Zahl".
Und hier noch einmal kleiner und ohne Skalen, aber dafür bis 50:
Dass ich den Lehrer "Fischer" genannt habe, soll natürlich eine kleine Ehrerweisung für Fisher sein: den Briten Ronald A. Fisher (1890–1962), dem wir bedeutende Errungenschaften der Statistik verdanken, namentlich das Maximum-Likelihood-Prinzip. Übrigens zählen fish und fisher zu den wenigen Wörtern, die im (Hoch-)Deutschen und im Englischen genau gleich lauten und auch das Gleiche bedeuten.
Schreiben Sie uns!
Beitrag schreiben