Lobes Digitalfabrik: Wie Google in die Zukunft schaut
Jeden Tag registriert Google 3,5 Milliarden Suchanfragen. Die Nutzer googeln alles: Hotels, Autos, Nachbarn, sexuelle Vorlieben, Einbruchpläne. Auf Google Trends, einem öffentlich zugänglichen Statistiktool, kann man für jede Region auf der Welt einsehen, welche Begriffe gerade besonders häufig gesucht werden. In den USA war vergangene Woche etwa »Tornadowarnung« auf Platz eins, in Deutschland schaffte es David Hasselhoff in die Suchtrends. Aus den aggregierten Daten lassen sich bestimmte Trends in der Gesellschaft ableiten. Worüber wird gerade gesprochen? Welche Produkte werden nachgefragt? Wie ist das Konsumklima? Die Suchmaschine ist eine Art Stimmungs- und Konjunkturbarometer. Zentralbanken greifen schon seit einiger Zeit auf Google-Daten zurück und speisen diese in ihre makroökonomischen Modelle ein, um das Konsumentenverhalten zu prognostizieren.
Im April 2009 publizierten Googles Chefökonom Hal Varian und seine Koautorin Hyunyoung Choi ein Paper (»Predicting the Present with Google Trends«), worin sie die These aufstellen, dass Suchmaschinendaten mit dem derzeitigen Niveau ökonomischer Aktivitäten in einzelnen Industrien korrelierten. Die Autoren betonen, dass sie mit den Daten nicht die Zukunft, wohl aber die Gegenwart vorhersagen können. Das klingt zunächst wenig spektakulär, doch angesichts der vielen Unbekannten, die makroökonomischen Entscheidungen zu Grunde liegen, macht das einen Unterschied. Die spannende Frage ist, wie weit die Gegenwart – den Begriff grenzen die Autoren zeitlich nicht näher ein – in die Zukunft reicht und ob man mit dem Datenmaterial nicht doch bestimmte Ereignisse in der nahen Zukunft berechnen könnte.
Google versuchte mit dem Big-Data-Dienst Flu Trends den Verlauf von Grippewellen zu prognostizieren. Ein Algorithmus analysierte dazu Suchbegriffe wie »Husten« oder »Fieber«, die mit Grippesymptomen korrelieren, und glich diese mit realen Krankheitsdaten ab. Die Modelle unterschätzten jedoch das Ausmaß der Schweinegrippe 2009, die Grippesaison 2012/13 dagegen wurde massiv überschätzt – hier schlugen die Algorithmen Alarm und meldeten eine drohende Epidemie. Das Problem war damals, dass die Modelle von einem statischen Verlauf der Gesellschaft ausgingen. Hinzu kam, dass die Daten selbst infiziert waren. Nicht jeder, der nach Grippesymptomen googelt, hat auch tatsächlich eine Grippe. Und nicht jeder, der an einer Grippe erkrankt ist, googelt. Womöglich kann man aber anhand der Suchmaschinendaten doch einige politische und ökonomische Trends identifizieren.
»Dem Suchmaschinenriesen sagen die Leute Dinge, die sie sonst niemandem sagen würden«
Der Datenanalyst Kan Nishida hat die Hypothese aufgestellt, mit Google-Daten ließe sich der Preisverlauf der Kryptowährung Bitcoin vorhersagen. Nishida importierte dazu die Trenddaten zum Suchbegriff »Bitcoin« und Preisdaten in ein Statistikprogramm und erstellte zwei Funktionsgraphen. Dabei identifizierte er eine auffällige Korrelation zwischen dem Kursverlauf der Kryptowährung und den Suchmaschinendaten. Die Bitcoin-Kurve folgte fast immer der Google-Kurve. Ende 2017, als Bitcoin einen Höchststand von mehr als 20 000 Dollar erreichte, waren auch die Google-Suchanfragen am höchsten. Reiner Zufall?
Nishida unterzog die Daten einer komplexen Regressionsanalyse. Und wieder zeigte sich: Die Google- und Bitcoin-Daten sind in hohem Maß korreliert. Der Autor fügt jedoch einschränkend hinzu, dass Korrelation nicht gleich Kausalität bedeute. Nur weil mehr Leute nach Bitcoin googeln, heißt das nicht, dass auch der Kurs der Kryptowährung steigt. Es gibt noch zahlreiche andere Einflussfaktoren. So könnten etwa Nachrichten über Bitcoin die Suchanfragen bei Google befeuern. Nun ist es im Nachhinein immer einfach, bestimmte Zusammenhänge zu plausibilisieren. Interessant sind diese Wechselwirkungen aber schon, zumal vielen Handlungen, seien es Produktkäufe oder Wahlen, Google-Suchen vorausgehen.
Der frühere Google-Datenwissenschaftler Seth Stephens-Davidowitz schreibt in seinem Buch »Everybody Lies – Big Data, New Data, and What the Internet Can Tell Us About Who We Really Are«, dass Google-Daten ein Indikator für die Popularität von Politikern sind. Dabei komme es weniger auf die Häufigkeit der Namensnennung – man kann nach einem Kandidaten ja sowohl aus Ablehnung als auch aus Zustimmung googeln –, sondern mehr auf die Reihenfolge an. Der Autor fand heraus, dass Nutzer die Person, die sie unterstützen, zuerst nennen. Wer Kombinationen wie etwa »Trump Clinton Polls« googelte, war mit signifikant höherer Wahrscheinlichkeit Trump-Wähler. In Schlüsselstaaten im Mittleren Westen, in denen Clinton in den Umfragen leicht vorne lag, gab es mehr Suchanfragen für »Trump Clinton« als für »Clinton Trump«. Das heißt, man hätte anhand der Google-Daten erahnen können, dass der Wahlausgang knapp werden könnte. Allein, mit dem Wahlsieg Trumps hatte niemand gerechnet – die Demoskopen lagen wie schon beim Brexit daneben. Die »New York Times« hatte noch am Wahlabend mit 84-prozentiger Wahrscheinlichkeit einen Wahlsieg Clintons prognostiziert. Wusste Google womöglich schon im Vorfeld, dass Trump gewinnen würde? Das ist freilich Spekulation. Fakt ist: Die Google-Daten zeichnen eine ganz andere politische Landkarte als die Meinungsbilder der Umfrageinstitute.
»Die Macht der Google-Daten liegt darin, dass die Leute dem Suchmaschinenriesen Dinge sagen, die sie sonst niemandem sagen würden«, konstatiert Stephens-Davidowitz. Man belügt Freunde, Familienangehörige, Behörden und auch Meinungsforscher, doch gegenüber der Suchmaschine Google sind Nutzer erstaunlich offen und ehrlich. Gut möglich, dass Google daher ein valideres Messinstrument ist als gewöhnliche Erhebungstechniken wie Umfragen. Problematisch wird es nur, wenn der Konzern bestimmte Dinge weiß, die den politischen Entscheidungsträgern verborgen bleiben – zum Beispiel sich anbahnende Epidemien, Kapitalabflüsse oder mögliche Radikalisierungstendenzen in der Gesellschaft. Die Auswirkungen dieser Privatisierung von Herrschaftswissen sind noch gar nicht absehbar.
Wenn Sie inhaltliche Anmerkungen zu diesem Artikel haben, können Sie die Redaktion per E-Mail informieren. Wir lesen Ihre Zuschrift, bitten jedoch um Verständnis, dass wir nicht jede beantworten können.