Freistetters Formelwelt: Zwei entscheidende Minuten
Auf Grund der Covid-19-Pandemie haben in diesem Jahr so gut wie keine sportlichen Veranstaltungen stattgefunden. Als jemand, der sich nur wenig für Fußball interessiert, hat mich aber etwa der Ausfall der Europameisterschaft eher wenig getroffen. Die Absage der vielen lokalen Laufwettbewerbe allerdings schon. Auch wenn ich zu langsam bin, um irgendwo um den Sieg mitzulaufen, war es immer ein sehr nettes Erlebnis, mit vielen Gleichgesinnten und vor Publikum zu laufen.
Eigentlich hatte ich für 2020 die Teilnahme an mindestens zwei Marathons geplant. Gelaufen bin ich nur einen, und den alleine und ohne professionelle Organisation auf den Feldwegen in meiner Umgebung. Das veranstaltungsarme Jahr hat mir aber immerhin die Gelegenheit gegeben, mich ein wenig intensiver mit meinem Lauftagebuch zu beschäftigen. Und mit der Statistik.
Alle Folgen seiner wöchentlichen Kolumne, die immer sonntags erscheint, finden Sie hier.
Zwischen 2014 und heute bin ich insgesamt 13 Marathons gelaufen. Ich wollte wissen, wie schnell ich im Durchschnitt war, und habe das getan, was man in so einem Fall meistens zuerst macht: nämlich das »arithmetische Mittel« berechnet. Ich habe also alle 13 Zeiten addiert und diese Summe durch 13 geteilt. Das Ergebnis: drei Stunden und 30 Minuten. Und auch wenn das eine durchaus respektable Zeit ist, kam mir der Wert ein wenig zu hoch vor.
Was vermutlich an meinem allerersten Marathon lag: Damals war ich noch etwas unerfahren, nicht ausreichend trainiert und habe drei Stunden und 54 Minuten bis ins Ziel gebraucht. Die restlichen zwölf Marathons lagen alle deutlich unter dieser Zeit. Mein erster Lauf hat meinen Schnitt also vermutlich stark gedrückt. Einfach ignorieren kann ich diesen Datenpunkt aber trotzdem nicht, so gern ich das auch würde. Für eine rein private Statistik wäre das zwar egal; aus meiner Zeit als Wissenschaftler habe ich aber immer noch eine starke Abneigung gegen so eine Art der Datenmanipulation.
Es gibt jedoch noch eine andere Art, einen Mittelwert zu berechnen, die für meinen Zweck deutlich sinnvoller ist. Und zwar den »Median«, der sich mit dieser Formel berechnen lässt:
Sie sieht komplizierter aus als das, was man bei der Berechnung tatsächlich machen muss. Zuerst werden alle Werte aufsteigend geordnet, von der langsamsten bis zur schnellsten Laufzeit. Der Median entspricht dann genau dem Wert, der in der Mitte dieser Liste zu finden ist. Oder, falls es sich um eine gerade Anzahl an Werten handelt, dem arithmetischen Mittel der beiden mittleren Zahlen.
Im Gegensatz zum arithmetischen Mittelwert ist der Median deutlich robuster gegenüber »Ausreißern«. Was nicht nur bei der Berechnung meiner durchschnittlichen Marathonlaufzeit praktisch ist, sondern auch bei jeder Menge anderer – und zugegebenermaßen relevanterer – Probleme. Zum Beispiel bei der Berechnung von Durchschnittseinkommen, da die Verteilung der Einkommen in einem Land meistens »schief« ist.
Das heißt, es gibt zwar viele Menschen mit einem »normalen« Einkommen, aber meistens auch immer ein paar mit einem enorm hohen Verdienst. Die drücken die Statistik nach oben, und bei der Berechnung eines arithmetischen Mittels erhielte man ein Durchschnittseinkommen, das zwar mathematisch korrekt ist, der Realität aber nicht entspricht. Bei solchen schiefen Verteilungen ist es wesentlich besser, den Median zu verwenden, der deutlich realistischere Ergebnisse liefert.
Im Falle meiner Marathonläufe komme ich bei der Berechnung des Medians auf eine Zeit von drei Stunden und 28 Minuten. Was sich für mich wesentlich besser anfühlt: Nicht nur, weil dieser Wert um zwei Minuten unter dem arithmetischen Mittel liegt. Sondern, weil ich die Mehrheit meiner Läufe tatsächlich unter dreieinhalb Stunden beziehungsweise nur knapp darüber absolviert habe. Und wer der Meinung ist, dass es auf diese zwei Minuten jetzt auch nicht mehr ankommt, ist vermutlich noch nie einen Marathon gelaufen.
Schreiben Sie uns!
Beitrag schreiben