Der Mathematische Monatskalender: Ronald Aylmer Fisher, der Vater der Statistik
Ronald Aylmer Fisher gilt nicht umsonst als der »Vater der modernen Statistik«. Seine zahlreichen und vielfältigen Beiträge zur mathematischen Theorie wie auch zu statistischen Anwendungen, insbesondere zur Versuchsplanung, die er von den 1920er Jahren an bis zu seinem Tod veröffentlichte, gaben wesentliche Impulse zur Entwicklung dieser Wissenschaft.
Ronald Aylmer wuchs als jüngstes Kind zusammen mit vier älteren Geschwistern im Londoner Stadtteil East Finchley auf. Der Vater verdiente den Unterhalt als Auktionator und Kunsthändler. Seinen zweiten Vornamen verdankte Ronald Aylmer einem ungewöhnlichen Einfall seiner Mutter; diese hatte den frühen Tod ihres dritten Kindes mit Namen Alan darauf zurückgeführt, dass in dessen Vorname kein »y« vorkam (die ersten beiden Kinder hatten die Vornamen Geoffrey und Evelyn).
Der mathematische Monatskalender
Ihre wissenschaftlichen Leistungen sind weit verbreitet, doch wer waren die Mathematik-Genies, die unser Verständnis der Welt nachhaltig prägten? Seine ersten »mathematischen Monatskalender« hatte Heinz Klaus Strick, ehemaliger Leiter des Landrat-Lucas-Gymnasiums in Leverkusen-Opladen, für seine Schülerinnen und Schüler geschrieben, ergänzt durch passende Briefmarken der vorgestellten Personen. Alle spannenden Lebensläufe, skurrilen Porträts und unglaublichen Geschichten hinter den namhaften Persönlichkeiten finden Sie hier.
Als der Junge 14 Jahre alt war, starb die Mutter und kurze Zeit danach verlor der Vater seine Arbeit. Doch dank eines Stipendiums konnte Ronald Aylmer ein Studium der Mathematik und Astronomie am Caius and Gonville College in Cambridge aufnehmen. Er interessierte sich auch für biologische Themen, unter anderem regte er die Gründung einer Eugenics Society an der Universität an.
Ein holpriger Weg in die Wissenschaft
1912 schloss Fisher seine Prüfung mit Auszeichnung ab; nach der Meinung seines Tutors hätte das Ergebnis noch besser ausfallen können, wenn er sich angestrengt hätte. Eine Zeitlang setzte er das Studium fort; insbesondere faszinierte ihn eine Schrift zur Fehlertheorie von George Biddell Airy (1801–1892), dem langjährigen Leiter des Observatoriums in Greenwich.
Fishers erste Veröffentlichung erfolgte noch im selben Jahr; sie befasste sich mit der so genannten Maximum-Likelihood-Methode zur optimalen Schätzung eines unbekannten Parameters, wenn der Typ der zu Grunde liegenden Verteilungsfunktion bekannt ist.
Beispiel für die Anwendung der Maximum-Likelihood-Methode:
In einer Urne befinden sich schwarze und weiße Kugeln, deren Anteil durch Ziehen einer gewissen Anzahl von Kugeln geschätzt werden soll. Wenn beispielsweise in einer Stichprobe von zehn Kugeln (Ziehen mit Zurücklegen) zwei schwarze Kugeln enthalten sind, dann erweist sich ein Anteil von p = 0,2 schwarzen Kugeln in der Urne als der mit der größten Wahrscheinlichkeit:
\[ P_{p=0,19} (X=2) = \binom{10}{2} \cdot 0,19^2 \cdot 0,81^8 \approx 0,3010\] \[ P_{p=0,2} (X=2) = \binom{10}{2} \cdot 0,2^2 \cdot 0,8^8 \approx 0,3020\] \[ P_{p=0,21} (X=2) = \binom{10}{2} \cdot 0,21^2 \cdot 0,79^8 \approx 0,3011\]
Um Geld zu verdienen, arbeitete Fisher einige Monate auf einer Farm in Kanada, danach als Statistiker in einer Londoner Investment-Firma. Als 1914 der Erste Weltkrieg ausbrach, meldete er sich begeistert zum Dienst in der Armee, wurde jedoch wegen einer angeborenen Sehschwäche ausgemustert. Danach unterrichtete Fisher eine Zeit lang Mathematik und Physik an verschiedenen Schulen, spielte aber auch mit dem Gedanken, eine eigene Farm zu kaufen und diese zu bewirtschaften.
1917 heiratete er heimlich Ruth Eileen Gratton Guinness, die wenige Tage zuvor 17 Jahre alt geworden war; in der lange Zeit glücklichen Ehe wurden neun Kinder geboren.
Eine Verknüpfung zwischen Biologie und Mathematik
1918 machte Fisher mit der Veröffentlichung des Beitrags »The Correlation between Relatives on the Supposition of Mendelian Inheritance« (Korrelation zwischen Verwandten unter der Annahme der mendelschen Vererbung) auf sich aufmerksam. Unter anderem zeigte er durch eine Modellrechnung, dass sich die Allelhäufigkeiten in einer Population durch natürliche Auslese verändern können.
Danach bot Karl Pearson ihm die Stelle als Chefstatistiker an den Galton Laboratories an, was Fisher aber auf Grund von (vermeintlich) schlechten Erfahrungen mit Pearson ablehnte.
Stattdessen nahm er eine befristete Stelle an der Rothamsted Experimental Station in Hertfordshire an – er blieb 14 Jahre lang. Ausschlaggebend für seine Entscheidung war vor allem die Tatsache, dass dort eine gewaltige Menge von Erntedaten zur Verfügung stand, die seit 1842 im Rahmen von »Classical Field Experiments« gesammelt wurden.
Bereits 1921 veröffentlichte Fisher die »Studies in Crop Variation« mit einer ersten Anwendung der von ihm entwickelten Varianzanalyse (Analysis of Variance, kurz: ANOVA): ein Prüfverfahren, bei dem untersucht wird, ob die Grundgesamtheiten von zwei durchgeführten Stichproben die gleiche Varianz besitzen.
Fisher nutzte die nahezu unbegrenzten Möglichkeiten in Rothamsted, um Erfahrungen im Hinblick auf die Versuchsplanung zu gewinnen. Ziel seiner Experimente war es, mit möglichst wenigen Versuchen den Einfluss möglichst vieler Faktoren herauszufinden. Im Prinzip können Experimente nach dem Prinzip »Versuch und Irrtum« (trial and error) durchgeführt werden oder, indem man einzelne Parameter abwechselnd und schrittweise verändert (one factor at a time), was allerdings sehr aufwändig ist und sehr kostspielig sein kann. Seine Erfahrungen veröffentlichte er zusammenfassend unter dem Titel »The design of experiments« (erst im Jahr 1935).
1924 folgte sein Beitrag »On a distribution yielding the error functions of several well known statistics«, in der er die (von ihm so bezeichnete) z-Verteilung einführte, die in Sonderfällen mit der studentschen t-Verteilung und der pearsonschen χ2-Verteilung übereinstimmt.
Der Statistiker William Sealy Gosset hatte – da sein Arbeitgeber, die Guinness-Brauerei in Dublin, seinen Angestellten keine eigenen Publikationen gestattete – im Jahr 1908 unter dem Pseudonym »Student« einen Beitrag veröffentlicht, in dem er zeigte, dass die standardisierte Schätzfunktion des Stichproben-Mittelwerts normalverteilter Daten selbst nicht normalverteilt, sondern t-verteilt ist, wenn die Varianz nicht bekannt ist, sondern durch die Stichprobenvarianz geschätzt werden muss.
1925 veröffentlichte Fisher das Werk »Statistical Methods for Research Workers«, eines der wohl einflussreichsten Statistikbücher des 20. Jahrhunderts. Unter anderem führte er in diesem Buch den p-Wert von p = 0,05 als Grenzwert für statistische Signifikanz ein. Bei einem zweiseitigen Test ist das die (Maximal-)Wahrscheinlichkeit dafür, dass ein Versuchsergebnis zufällig außerhalb der 1,96σ-Umgebung des Erwartungswerts m liegt.
In dem oben angegebenen 1935 veröffentlichten Werk zur Versuchsplanung verwendete Fisher dann die Geschichte der »tea testing lady«, um die Vorgehensweise eines randomisierten Experiments und die Strategie eines so genannten Hypothesentests zu erläutern:
Die betreffende Dame behauptet, sie könne am Geschmack erkennen, ob zuerst der Tee oder zuerst die Milch in die Tasse gegeben wurde. Fishers Versuchsanleitung sieht vor, die angebliche Fähigkeit dadurch zu überprüfen, dass der Dame in zufälliger Reihenfolge hintereinander acht Tassen Tee serviert werden, je vier von jeder Sorte. Die Wahrscheinlichkeit, mit der eine gewisse Anzahl von Tassen einer Sorte zufällig erraten wird, kann mit Hilfe eines hypergeometrischen Ansatzes berechnet werden:
Es gibt 70 Möglichkeiten (acht über vier), die vier Tassen einer Sorte auf die acht Plätze zu verteilen; davon gibt es genau eine Möglichkeit dafür, dass keiner beziehungsweise jeder der Rateversuche richtig ist, \(\binom{4}{1}\cdot\binom{4}{3}\) = 16 Möglichkeiten für einen beziehungsweise für drei Treffer und \(\binom{4}{2}\cdot\binom{4}{2}\) = 32 Möglichkeiten für zwei Treffer. Bei einem Signifikanzniveau von 5 Prozent kann die Nullhypothese »Die Dame verfügt nicht über die von ihr behauptete Fähigkeit« nur dann verworfen werden, wenn sie alle Tassen richtig zuordnet (denn die Wahrscheinlichkeit für das zufällige achtfach richtige Raten beträgt 1/70, also zirka 1,4 Prozent).
Mit Hypothesentests von kleinen Stichproben beschäftigt sich auch der so genannte »Exakte Test von Fisher«, bei dem Daten in Vierfeldertafeln (Kontingenztafeln) untersucht werden. Dabei werden die Randwerte als gegeben angenommen und es wird die Wahrscheinlichkeit dafür bestimmt, dass die beobachtete oder eine noch extremere Besetzung der Tafel zufällig zu Stande kommt.
In seinem Werk »The Genetical Theory of Natural Selection«, das 1930 erschien, ging Fisher auf die Frage ein, warum in den »zivilisierten Gesellschaften« eher die schwachen als die starken Individuen gefördert würden: Das natürliche Prinzip »survival of the fittest« würde seiner Meinung nach künstlich zu Gunsten der Schwachen der Gesellschaft verändert; eher solle man die »gesunden Mitglieder der Gesellschaft« finanziell unterstützen. Er ging sogar so weit, dass er den Niedergang von Zivilisationen in der Menschheitsgeschichte mit der geringen Fertilität der oberen Gesellschaftsschichten in Verbindung brachte. Insofern ist es nicht verwunderlich, dass der bekennende Eugeniker Fisher 1933 als Nachfolger Pearsons als Leiter des Department of Eugenics am University College London ernannt wurde.
Vom Statistiker zum führenden Eugeniker
Mit Karl Pearson hatte er zwischenzeitlich heftige fachliche Auseinandersetzungen, unter anderem hinsichtlich der Anwendung des χ2-Unabhängigkeitstests in Kontigenztafeln, wobei beide stets auch ihre gegenseitige persönliche Abneigung nicht verbargen.
Seine Ansichten über Eugenik änderte Fisher auch nach den Erfahrungen mit den Verbrechen des Nationalsozialismus nicht. Vielmehr trug sein Entlastungsschreiben mit dazu bei, dass Otmar Freiherr von Verschuer, Leiter des Kaiser-Wilhelm-Instituts für Anthropologie, menschliche Erblehre und Eugenik in Berlin, nach dem Krieg nur als Mitläufer eingestuft wurde und seine Karriere als Professor für Humangenetik an der Universität Münster fortsetzen konnte – obwohl er während des Kriegs engen wissenschaftlichen Kontakt zu seinem ehemaligen Doktoranden Josef Mengele hatte.
Von 1943 bis 1956 übernahm Fisher in Cambridge einen Lehrstuhl für Genetik; nach seiner Emeritierung emigrierte der fachlich sehr angesehene und vielfach geehrte Wissenschaftler (darunter auch mit der Erhebung in den Adelsstand durch Elisabeth II) nach Adelaide in Australien, um dort seine Studien fortzusetzen.
Erwähnt werden sollte ebenfalls noch eine Episode aus dem Jahr 1950: Als eine Studie über den möglichen Zusammenhang zwischen Rauchen und Lungenkrebserkrankungen veröffentlicht wurde, widersprach Fisher, da seiner Meinung nach die aufgezeigten Korrelationen nicht unbedingt auf kausale Bedingungen hinwiesen. Es ist nicht auszuschließen, dass Fisher für seine Stellungnahme Geld von der Tabakindustrie erhalten hatte. Es könnte aber auch sein, dass der leidenschaftliche Pfeifenraucher Fisher einfach nur deshalb widersprach, weil er eine mögliche Einschränkung seiner Gewohnheiten durch die »Puritaner« befürchtete.
Schreiben Sie uns!
Beitrag schreiben