Die fabelhafte Welt der Mathematik: Wie Mathematik den Alliierten half, den Zweiten Weltkrieg zu gewinnen
Anfang der 1940er Jahre standen die Alliierten vor einem Problem: Auf den Kampfplätzen tauchten vermehrt neue Panzer auf, die wesentlich leistungsfähiger schienen als die älteren Modelle der Nationalsozialisten. Besonders beängstigend war, dass Großbritannien, die USA und Co nicht wussten, wie viele die Wehrmacht produzierte. Diese Information war allerdings entscheidend, um die Operation Overlord vorzubereiten, die Landung der Alliierten in der Normandie. Deshalb betraute man Geheimdienste mit der Aufgabe, die feindlichen Produktionsdaten zu ermitteln. Und man beauftragte Mathematiker.
Während der Kämpfe konnten die Alliierten einige gegnerische Panzer bergen. Als sie diese untersuchten, stießen sie bei manchen Bauteilen auf Seriennummern. Statistikerinnen und Statistiker nahmen sich die Zahlenfolgen vor – und machten eine erstaunliche Entdeckung. Auf den Fahrgestellen waren die Ziffern zwar in verschiedene, unzusammenhängende Intervalle unterteilt, doch die Getriebe schienen aufsteigend nummeriert zu sein, ebenso wie die Panzerkanonen, Heizungen, Laufräder oder Turmmotoren. Mit all den gesammelten Daten konnten die Fachleute abschätzen, wie viele neue Panzer die Wehrmacht monatlich hergestellt hatte. Im Nachhinein stellte sich tatsächlich heraus, dass die mathematischen Ergebnisse für das so genannte »German Tank Problem« wesentlich näher an der Wahrheit lagen als alle anderen Schätzungen.
Stellen Sie sich dazu folgendes Szenario vor: Angenommen, es gibt N = 271 Panzer, die aufsteigend von 1 bis 271 nummeriert sind. Sie kennen die Zahl N nicht, doch es ist Ihnen gelungen, 15 feindliche Panzer zu bergen, mit der Aufschrift: 3, 7, 17, 80, 92, 96, 98, 116, 125, 138, 166, 167, 199, 232, 242. Sie wissen also mit Sicherheit, dass es mindestens 242 generische Panzer gibt. Aber es könnten auch wesentlich mehr sein. Um N abzuschätzen, gehen Sie davon aus, dass die 15 Kampffahrzeuge vollkommen zufällig erobert wurden – sprich: Sie haben eine willkürliche Stichprobe von 15 Zahlen aus N möglichen Zahlen gezogen.
Vier Methoden, um die Anzahl der deutschen Panzer zu schätzen
Nun können Sie N abschätzen, indem Sie den Median der Stichprobe berechnen. Dabei handelt es sich um die Zahl, die in der geordneten Liste genau in der Mitte liegt. Die Stichprobe enthält demnach ebenso viele kleinere wie größere Werte als der Median. In unserem Beispiel ist der Median m' die achte Zahl, also m' = 116. Eine mögliche Schätzung wäre, dass der Median der Stichprobe m' mit dem Median der Liste aller N Panzer übereinstimmt. Für eine solche aufsteigende Liste aus N Zahlen beträgt der Median, wenn N ungerade ist: m = (N + 1)/2. Damit kann man eine erste Schätzung N1 mit Hilfe des Medians der Stichprobe m' vornehmen: N1 = 2m'−1 = 2·116−1 = 231. Für einen ersten Versuch ist das Ergebnis gar nicht so schlecht. Allerdings ist die höchste Zahl unserer Stichprobe 242, also muss N größer sein.
Etwas besser könnte es daher sein, nicht den Median, sondern den Mittelwert der Stichprobe zu berücksichtigen. In einer Liste 1, 2, 3, … , N sind Median und Mittelwert gleich, doch in der Stichprobe können beide Werte voneinander abweichen. Den Mittelwert erhält man, indem man alle Zahlen summiert (1778) und durch ihre Anzahl teilt, also M = 1778/15 ≈ 119. Damit kann man nun anhand der gleichen Formel wie für den Median (N2 = 2M−1) eine zweite Schätzung N2 für die Anzahl der Panzer treffen und erhält: N2 = 2·119−1 = 237. Leider liegt auch dieser Wert unterhalb von 242 und kann somit nicht richtig sein.
Um sicherzustellen, dass die Schätzung nicht kleiner als die größte Zahl der Stichprobe ausfällt, kann man beispielsweise annehmen, dass am Anfang der Liste genauso viele Panzer übersehen wurden wie am Ende der Liste. Das würde bedeuten, dass man die Anzahl der Panzer, die vor der kleinsten Zahl der Stichprobe nmin = 3 liegen, zur größten Zahl nmax = 242 addieren muss. Dadurch ergibt sich eine dritte Schätzung: N3 = 2 + 242 = 244.
Noch genauer sollte das Ergebnis aber ausfallen, wenn man die durchschnittlichen Abstände der Zahlen in der Stichprobe betrachtet. Um den mittleren Abstand d zu ermitteln, berechnet man also die Differenz aller benachbarten Zahlen und bildet daraus den Mittelwert: d = 1⁄15 · [(nmin−1) + (n1−nmin−1) + (n2−n1−1) + … + (n13−n12−1) + (nmax−n13−1)] = 1⁄15 · nmax − 1. Der mittlere Abstand d hängt also im Endeffekt nur von der größten Zahl unserer Stichprobe ab und lautet: d = 242/15 − 1 = 15. Diesen kann man nun auf nmax addieren, um eine vierte Schätzung zu erhalten: N4 = 257 – was ziemlich nah am tatsächlichen Ergebnis liegt.
Genau diese Methode haben die Alliierten genutzt, um die Panzerproduktion der Deutschen zu untersuchen. Mit beeindruckendem Erfolg, wie die Tabelle zeigt:
Monat | statistische Schätzung | geheimdienstliche Schätzung | deutsche Aufzeichnungen |
---|---|---|---|
Juni 1940 | 169 | 1000 | 122 |
Juni 1941 | 244 | 1550 | 271 |
August 1942 | 327 | 1550 | 342 |
Welche Methode ist die beste?
Um herauszufinden, ob die vorgestellten Ansätze wirklich geeignet sind, um solche Vorhersagen zu treffen, kann man so genannte Monte-Carlo-Simulationen durchführen. Dafür setzt man verschiedene Werte von N fest und wählt zufällig unterschiedliche Stichproben der Größe n aus, mit denen man die beiden Schätzungen N3 und N4 ermittelt. Indem man das Experiment (bestenfalls am Computer) immer wieder wiederholt, kann man die Wahrscheinlichkeitsverteilungen von N3 und N4 untersuchen sowie deren Mittelwerte und Varianzen. Wie sich herausstellt, konvergieren beide Mittelwerte gegen den tatsächlichen Wert N. Doch die Varianz von N4 fällt kleiner aus als die von N3. Somit ist die letzte Methode die verlässlichste – damit haben die Alliierten wohl alles richtig gemacht.
Diese Art der statistischen Schätzung kann sich auch in anderen Situationen als hilfreich erweisen. So verwendete der Statistiker Pere Grima von der Polytechnischen Universität von Katalonien die Methode, um die Anzahl der zugelassenen Taxis in Barcelona zu ermitteln. Auf deren Hintertür ist nämlich ihre Lizenznummer verzeichnet, die aufsteigend vergeben wird. Grima notierte 20 Taxilizenzen von vorbeifahrenden Wagen, wobei die höchste 10 467 lautete. Damit konnte er N4 berechnen: N4 = 10 467 + 10 467/20 − 1 = 10 989. Auf der offiziellen Website gab die Stadt Barcelona an, 10 481 Taxis lizensiert zu haben.
Im Prinzip lassen sich solche Abschätzungen immer treffen, sobald man eine Menge von nummerierten Objekten antrifft, wie Marathonläufer oder manche elektronischen Geräte. An der Anzahl Letzterer sind vor allem Unternehmen interessiert, die gerne erfahren würden, wie viele Produkte die Konkurrenz herstellt. Oftmals sind diese Daten geheim, weshalb Firmen die Seriennummern meist mit Hilfe eines Zufallsgenerators vergeben und nicht in aufsteigender Reihenfolge. Doch manche Geräte bilden eine Ausnahme, zum Beispiel wurde die Anzahl aller verkauften Commodore-64-Computer auf diese Weise auf etwa 12,5 Millionen geschätzt, sowie die Zahl der bis Ende 2008 verkauften iPhones vom Modell 3G (anhand ihrer IMEI-Gerätenummern). In beiden Fällen wurden die Nutzerinnen und Nutzer der jeweiligen Geräte aufgerufen, die Seriennummern samt Kaufdatum in einem Forum zu veröffentlichen.
Auch dem US-amerikanischen Offizier Trevor Dupuy war die Macht von Statistik bekannt, als er dem Mathematiker Roger W. Johnson im Jahr 1991 erzählte: »Vor ein paar Jahren durfte ich mit Erlaubnis des israelischen Militärs die gesamte Produktionslinie der Merkava-Panzer besichtigen. Als ich fragte, wie viele insgesamt produziert worden waren, teilte man mir mit, die Information sei geheim. Ich fand das amüsant, denn auf allen Fahrgestellen war die Seriennummer sichtbar.«
Was ist euer Lieblingsmathetheorem? Schreibt es gerne in die Kommentare – und vielleicht ist es schon bald das Thema dieser Kolumne!
Schreiben Sie uns!
14 Beiträge anzeigen