Direkt zum Inhalt

Leseprobe »Unsicherheiten, aber sicher!«: Auf ein Date mit Daten

Das Sachbuch gibt eine allgemeinverständliche Einführung in den Umgang mit Unsicherheiten von Daten und sensibilisiert dafür, Daten nicht unreflektiert als richtig hinzunehmen. Es macht die Leser darauf aufmerksam, wie Unsicherheiten in Daten in vielen Alltagssituationen auftreten und höchst relevant sein können, z.B. um persönliche Entscheidungen zu treffen, an politischen Wahlen teilzunehmen und wissenschaftliche Studien einzuschätzen. Eine Leseprobe
Datenvisualisierung

Wo spielen Daten eine Rolle? Was sind Daten? Wo begegnen wir unsicheren Daten? Woher kommen Unsicherheiten in Daten?

Als ich im letzten Jahr in einer Arztpraxis auf einem Fragebogen meinen Beruf angegeben hatte, wurde ich von meinem Arzt gefragt, was Didaktik der Physik eigentlich ist. »Was Physik ist, weiß ich in etwa…«, sagte der Arzt »und was Didaktik ist, kann ich mir auch halbwegs vorstellen – das hat mit Lernen zu tun. Aber beides zusammen?« »Also«, sagte ich, »stellen Sie ich vor, Sie müssten Medizinstudierenden Physik beibringen. Physikdidaktiker können Ihnen sagen, wie das am besten geht. Dazu gehört die Auswahl der richtigen Inhalte und Experimente, die Formulierung der Kompetenzen, die die Studierenden erwerben müssen, und natürlich die Verfahren, wie man ihren Lernerfolg überprüft. Und das alles auf Mediziner zugeschnitten.« »Ja, und was ist daran Forschung?«, wurde ich daraufhin gefragt, »Das macht doch jeder Lehrkraft.« Die Antwort ist ganz einfach. Zum einen müssen neue Themen, wie z. B. Ergebnisse aus der Forschung zur Kernspinresonanz, 1 zunächst so aufbereitet werden, dass sie nicht nur von Physikerinnen und Physikern verstanden werden, sondern auch von Medizinerinnen und Medizinern. Zum anderen müssen die Inhalte dann in gute und funktionierende Vermittlungskonzepte integriert werden. »In Forschungsprojekten wird untersucht, ob, wie und unter welchen Bedingungen Physik am besten gelernt werden kann«, lautete deshalb meine Antwort. »Forschung in der Physikdidaktik ist also manchmal so ähnlich wie Forschung in der Medizin«, versuchte ich zusammenzufassen. Es wird ein Defizit diagnostiziert – eine Wissenslücke bzw. eine Krankheit –, dann auf Basis des Forschungsstandes ein Hilfsmittel entwickelt – ein Lehrkonzept bzw. eine Therapie – und diese dann mit Probandinnen und Probanden – Lernenden bzw. Erkrankten – auf Wirksamkeit überprüft. Letzteres geht z. T. nicht ohne empirische Daten. Mit diesen kurzen Ausführungen endete mein Versuch, in wenigen Minuten einen Einblick in Arbeitsbereiche eines Physikdidaktikers zu geben. »Ich erspare Ihnen jetzt mal die Lernerfolgskontrolle«, scherzte ich abschließend. »Ach, glauben Sie mir…« konterte mein Arzt, »ich könnte jeden Ihrer Sätze wiedergeben.«

Datenbildung und Bildungsdaten

Egal ob bei naturwissenschaftlichen, medizinischen oder didaktischen Studien: Gemessen wird nicht nur in techniknahen Gebieten, sondern in fast allen Lebensbereichen zur Beantwortung von gesellschaftlichen, politischen, wissenschaftlichen und alltäglichen Fragen. Deshalb spielen Daten und deren Qualität auch in praktisch allen Lebens- und Wissensbereichen eine bedeutsame Rolle.

Da sich dieses Buch der Datenbildung, des informierten Umgangs mit Daten, widmet, lohnt sich auch ein kurzer Blick auf Bildungsdaten, also die Bedeutung von Daten in der Bildung. Denn dieses Buch basiert an einigen Stellen auf empirischen Studien mit Lernenden, da im Kontext des Vermittelns eines informierten Umgangs mit Daten auch Daten erhoben werden, um z. B. Lehrkonzepte auf deren Erfolg zu überprüfen, ähnlich wie ich das im obigen Beispiel meines Arztbesuchs angedeutet habe.

1765 schrieb der englisch-US-amerikanische Naturphilosoph und Theologe Joseph Priestley: »Bildung ist genauso eine Kunst (basierend, wie alle Künste, auf Wissenschaft) wie Landwirtschaft, wie Architektur oder Schiffsbau. In allen diesen Fällen stellt sich uns ein praktisches Problem, das mit der Hilfe von Daten, mit denen uns Erfahrung und Beobachtung ausstatten, gelöst werden muss.«2 Bildung sollte demnach auch auf Daten beruhen, die aus systematischen Erfahrungen, Beobachtungen und Erhebungen stammen. Natürlich sollten diese Daten »belastbar« sein, d. h. objektiv (die Daten werden nicht vom Messenden beeinträchtigt), gültig (die Daten passen zu dem, was gemessen werden sollte) und zuverlässig (die Daten können reproduziert werden).3 Es ist meiner Ansicht nach beachtlich und vorausschauend, dass Priestley bereits vor sehr langer Zeit darauf hinwies, dass Bildung auch datengestützt entwickelt werden soll.

Nach diesem kurzen Ausflug über die Bedeutung von Daten in der Bildung richten wir das Augenmerk auf den grundlegenden Begriff Daten. In der Einleitung wurde bereits angemerkt, dass in diesem Buch bei naturwissenschaftlichen Themen ein eher enger Begriff von Daten im Sinne von Zahlenangaben aus Ergebnissen von Messungen und Prognosen verwendet wird. Dem steht ein umfassenderer Begriff von Daten bei gesellschaftlichen oder alltäglichen Themen gegenüber, da hier mitunter Daten vorliegen, die nicht unbedingt aus Messungen oder Rechnungen stammen. Der Übersicht halber soll deshalb kurz ein allgemeiner Blick auf den Begriff Daten geworfen werden.

Vielfalt der Datenwelt

Priestley benutzte bereits vor gut 250 Jahren das Wort Daten in seiner heutigen Bedeutung. Dabei war er natürlich nicht der Erste, der mit Daten gearbeitet hat. Daten werden mindestens seit 7500 v. Chr. erhoben und gespeichert, wie Funde von Tonobjekten im Nahen Osten zeigen.4 So sollen im »alten« Ägypten bereits Bilanzen von Ernten in Form von Daten dokumentiert worden sein. Das Wort selbst taucht dann rund 300 v. Chr. in Euklids Buch Dedomenai (im Lateinischen Daten) auf, einer Abhandlung über die Geometrie. In dem Sinne, wie wir das Wort heute in seiner oft eher empirisch geprägten Begrifflichkeit verstehen, wird es etwa seit 16505 verwendet. Aber wie sieht dieses heutige Verständnis von Daten aus?

Die Datenwelt ist vielfältig: Videos, Bilder, Texte und Nutzerprofile sind in Form von Daten digital gespeichert. Das ganze Finanzwesen von den Preisen im Supermarkt über die eigene Lohnsteuerabrechnung bis hin zum Bundeshaushalt wird durch Daten beschrieben. Adress- und Nutzerdaten sind Ware, die Firmen untereinander verkaufen. Daten über das Wetter und über Termine werden ständig ausgetauscht. Große Mengen an Daten begegnen uns wie selbstverständlich im täglichen Leben.

Ganz allgemein bezeichnen Daten (Einzahl: Datum; aus dem Lateinischen für »das Gegebene«) die Art und Weise oder Form der Darstellung einer Information. Häufig wird eine numerische Darstellung von Daten durch Zahlen verwendet.

Daten können unter anderem sein:

  1. direkte Resultate von Messungen, z. B. das Gewicht eines Pakets, die Helligkeit einer Lampe oder der Luftdruck auf dem Gipfel des Matterhorns,
  2. Ergebnisse von Rechnungen, z. B. das Resultat der Umrechnung eines EUR-Geldbetrags in Norwegische Kronen, die Mietausgaben pro Quadratmeter oder der durchschnittliche Benzinverbrauch eines Autos in Liter pro 100 km Fahrstrecke,
  3. Abschätzungen oder Prognosen, z. B. hinsichtlich der Weltbevölkerung, der Anzahl an Leserinnen und Lesern einer Webseite, der Bestimmung der Anzahl von Besucherinnen und Besuchern einer Veranstaltung oder die Vorhersage der morgigen Tageshöchsttemperatur,
  4. Protokollierungen von Beobachtungen, z. B. die Beschreibung der Wolkenbedeckung des Himmels, des Verhaltens von Zootieren bei der Paarung oder die Analyse des Lichts aus fernen Galaxien.

Damit liefern sowohl empirische Erhebungen wie Tests und Messungen als auch auf theoretischen und experimentellen Überlegungen basierende Rechnungen wie Prognosen Ergebnisse in Form von Daten. Die Ergebnisse und die Unsicherheiten von Tests, Prognosen und insbesondere von Messungen spielen in diesem Buch eine besondere Rolle, da sie sich vielfach durch Zahlenwerte ausdrücken lassen und deshalb besonders gut für Analysen, Vergleiche und Bewertungen eignen.

Alltägliche Unsicherheiten

Abfahrts- und Ankunftszeiten, Lieferzeiten, Kursentwicklungen, Körper- und Gepäckgewicht, Gewichte von Back- und Kochzutaten, Wettervorhersagen, Blutdruck- und Blutbildwerte: Auch wenn wir es nicht immer direkt merken, Unsicherheiten in Daten begegnen uns fortlaufend im täglichen Leben. Beim Reisen fragen wir uns, wann genau wir wohl ankommen, und ob die Zug- oder Busabfahrten planmäßig oder verspätet sind. Beim Kauf von Produkten wie Obst und Gemüse im Supermarkt oder von Kraftstoff an der Zapfsäule ist es wichtig, dass ausreichend genau gemessen wird. Das Gleiche gilt auch für die Personenwaage zu Hause und für die Gepäckwaage am Flughafen. Unsicherheiten begegnen uns auch im Haushalt, z. B. wenn es heißt, eine Pflanze »gut« gießen: Wie viel Milliliter Wasser sind das? Und: Muss ich das überhaupt so genau wissen? Ähnlich ist es, wenn im Kochbuch eine Prise Salz für ein Gericht angegeben wird. Wie viel Gramm Salz sind das? Aber hilft mir der entsprechende Wert in Gramm beim Kochen überhaupt weiter? Schließlich werden wir in den Medien fortlaufend mit Daten konfrontiert, deren Qualität wir nicht abschätzen können. Wie gut ist die Wettervorhersage? Wie viele Personen haben an einer Demonstration teilgenommen? Wie stark ist das Bruttoinlandsprodukt gestiegen? Wann wird ein Vulkan ausbrechen? Überall verbergen sich Unsicherheiten: in der Zeit, im Gewicht, im Volumen, in der Temperatur, in der Anzahl …

Wann Unsicherheiten in Daten nicht wichtig sind

In diesem Buch geht es vorrangig um solche Unsicherheiten in Daten, die wichtig für die Beurteilung von Ergebnissen sind. Natürlich ist das nicht immer der Fall. In vielen Situationen kommen wir mit Unsicherheiten in Daten ohne Weiteres gut klar. Wir können Erfahrungen damit sammeln und diese somit – mehr oder weniger bewusst – abschätzen und damit umgehen. Ich weiß in etwa, wie viel eine Prise Salz ist und wie viel ich bei Verabredungen zu spät kommen darf. Ich gehe davon aus, dass ein Sack mit der Aufschrift 1 kg Kartoffeln nicht genau 1,000000000 kg Kartoffeln enthält, sondern eine Masse irgendwo in der Nähe von 1 kg hat. In der Nähe meint, dass die Unsicherheit der Mengenangabe vergleichsweise klein ist gegenüber der gesamten Menge, sodass ich sie vernachlässigen kann. Etwas Ähnliches gilt bei der Bestimmung der Schuhgröße (siehe Titelbild des Buchs). Es genügt zu wissen, das diese z. B. bei etwa 41 liegt. Denn zum einen kann die Fußlänge selbst im Laufe eines Tages etwas schwanken. Für Langstreckenläufe kaufe ich immer »zu große« Schuhe, da die Füße etwas anschwellen. Zum anderen fallen Schuhe einer Größenangabe unterschiedlich aus. Jeder kennt das, der mal Schuhe einer Größe von unterschiedlichen Marken anprobiert hat. Es ist also wenig sinnvoll, die eigene Schuhgröße mit 41,129 anzugeben, 41 ± 1 reicht in der Regel völlig aus. Etwas schwerer ist es, vorab abzuschätzen, mit welchen Verspätungen – Unsicherheiten in der Ankunft – ich beim Bahn- oder Autofahren rechnen muss. Der Fahrplan der Bahn oder das Navi im Auto geben eindeutige Ankunftszeiten an, jedoch lehrt die Erfahrung, dass das tatsächliche Eintreffen am Zielort deutlich später sein kann. Manchmal ist es sehr wichtig, diese möglichen Abweichungen vorher abzuschätzen. Schließlich können bei »Messungen« mit den Sinnen Unsicherheiten auftreten: Wann ist ein Musikinstrument – z. B. eine Gitarre – »richtig« gestimmt? Mein Höreindruck – die von mir tolerierte Spannweite der Töne – für eine richtig gestimmte Gitarrensaite ist vermutlich ein anderer als der von professionellen Musikerinnen und Musikern.

Es kann in all diesen Beispielen Unsicherheiten in den Daten geben, im Gewicht des Salzes, in der Größe eines Schuhs, in der Zeit der Ankunft beim Reisen, in der Frequenz des gehörten Tons eines Instruments usw. Diese sind für Laien jedoch nicht wirklich bedeutsam, solange die Suppe nicht versalzen schmeckt, ein Schuh vorher anprobiert werden kann, der Zug nicht bereits abgefahren ist oder die Töne nicht allzu schräg klingen. Wir müssen uns deshalb auch oft nicht darum kümmern. Letztlich ist das Kriterium zu entscheiden, ob Unsicherheiten berücksichtigt werden müssen oder nicht, die Abschätzung, welche Konsequenzen die Unsicherheiten nach sich ziehen würden. Beeinträchtigen uns diese nicht oder lassen sich diese vergleichsweise schnell verringern, dann schenken wir diesen keine große Aufmerksamkeit.

Unsicherheiten trotz guter Messungen

Wenn es so ist, dass beim Messen Unsicherheiten auftreten, dann liegt die Frage nah: Woher kommen diese Unsicherheiten eigentlich? Wir werden das in Kapitel 7 noch genauer beantworten. Vorneweg möchte ich aber schon auf zwei Aspekte von Unsicherheiten hinweisen:

  1. Ein Messinstrument ist nur begrenzt genau. Alle Messinstrumente sind in ihrer Genauigkeit begrenzt. Es gibt Kilometerzähler in Autos, die können Entfernungen unter 100 m nicht präzise messen. Es ist also möglich, z. B. 50 m zu fahren, ohne dass sich bei den Zahlen am Kilometerzähler etwas geändert hat. Ein anderes Mal werden erneut 50 m zurückgelegt, und die Anzeige weist nun 100 m mehr aus. Weiterhin ist die Richtigkeit des Kilometerzählers eingeschränkt: Er zählt z. B. auf einer Strecke von 1000 km eine bestimmte Anzahl an Kilometern zu viel oder zu wenig. So hat jedes Messgerät seine Grenzen in der Genauigkeit.
  2. Der Wert schwankt bei wiederholter Messung. Fahre ich mit dem Auto wiederholt die gleiche Strecke, also etwa von der Wohnung zur Arbeit, dann ergibt sich häufig, wenn die Stecke auf dem Kilometerzähler ablesen wird, ein etwas anderes Ergebnis. Die Reifen sind ja nicht haargenau auf dem gleichen Weg über den Boden gerollt, es gibt leichte Schwankungen, je nachdem, wie und wo gefahren wurde. Oder werden beispielsweise die Körpertemperatur oder der Blutdruck mehrmals direkt hintereinander mit demselben Gerät gemessen, so treten nicht selten jeweils Werte auf, die etwas unterschiedlich sind. Diese Unterschiede können durch kleine Veränderungen etwa des Messorts am Körper, der Umgebungstemperatur, der körperlichen Aktivität, der Emotionen oder der Handhabung des Messgeräts hervorgerufen worden sein. Unterschiedliche Messwerte bei wiederholten Messungen treten nicht selten auf. Die damit verbundenen Schwankungen verursachen eine Unsicherheit.

In den beiden Fällen (1) und (2) gilt, dass durch die Unsicherheiten auch andere Werte oberhalb bzw. unterhalb des gemessenen Wertes hätten herauskommen können bzw. herausgekommen sind. Auch wenn es ungewohnt klingt: Die unterschiedlichen Ergebnisse der Messungen sind alle gleichberechtigt und alle korrekt.

Bislang wurden die Begriffe Genauigkeit und Unsicherheit verwendet, ohne genau zu erläutern, was damit gemeint ist. Das wird im folgenden Kapitel am Beispiel von Messungen und Prognosen nachgeholt. Vor diesem Hintergrund werden dann verschiedene Beispiele aus Gesellschaft und Alltag aufgezeigt, in denen Unsicherheiten nicht oder nur sehr »schwammig« angegeben werden, obwohl eine konkrete Angabe vielleicht besser für das Verständnis von Ergebnissen wäre.

Zusammenfassung

  • Daten spielen nicht nur in Naturwissenschaft und Technik eine Rolle, sondern werden in praktisch allen Lebensbereichen der Menschen gesammelt, ausgewertet und dienen als Grundlage des eigenen Handelns oder des Handelns anderer Personen.
  • Daten sind eine Art und Weise, Informationen darzustellen. Sie können z. B. in Form von Zahlen ausgedrückt werden.
  • Viele Daten aus Tests, Messungen und Prognosen sind mit Unsicherheiten verbunden, deren Kenntnis wichtig für die Analyse der Ergebnisse ist.
  • Unsicherheiten treten auf, da zum einen Messgeräte nur eine begrenzte Güte haben und deshalb nicht beliebig genau sind. Zum anderen können Werte bei wiederholten Messungen schwanken. Diese Schwankungen führen zu einer Unsicherheit im gemessenen Ergebniswert.

Fußnoten

  1. Die Kernspinresonanz ist das physikalische Phänomen, das der Magnetresonanztomografie (MRT) zugrunde liegt.
  2. Übersetzt vom Autor aus Rosenberg, D. (2013). Data before the Fact, in: L. Gitelman, »Raw Data« is an Oxymoron, Cambridge: MIT Press, S. 17. https://doi.org/10.7551/mitpress/9302.001.0001.
  3. Dieses Werk möchte diesem Anspruch folgen, indem für die dargestellten Inhalte und Aussagen Belege angegeben werden.
  4. Rendgen, S. (2018). What do we mean by »data«? https://idalab.de/what-do-we-mean-by-data/
  5. Rosenberg, D. (2013). Data before the Fact, in: L. Gitelman, »Raw Data« is an Osxymoron, Cambridge: MIT Press, S. 16, https://doi.org/10.7551/mitpress/9302.001.0001.

Schreiben Sie uns!

Wenn Sie inhaltliche Anmerkungen zu diesem Artikel haben, können Sie die Redaktion per E-Mail informieren. Wir lesen Ihre Zuschrift, bitten jedoch um Verständnis, dass wir nicht jede beantworten können.

Bitte erlauben Sie Javascript, um die volle Funktionalität von Spektrum.de zu erhalten.