GraphCast: Neues KI-Modell sagt sogar Extremwetter voraus
Rasche und vor allem präzise Wettervorhersagen gewinnen angesichts zunehmender Extremwetterereignisse an Bedeutung. Vorhersagen mit globaler Reichweite und Gültigkeit gelten allerdings weiterhin als große wissenschaftliche Herausforderung. Dabei sind sie für viele Bereiche wie etwa den Katastrophenschutz, die Stromerzeugung mittels erneuerbarer Energien oder die Logistik von großem Interesse. Bislang liegen sie jedoch oftmals daneben. Üblicherweise beruhen Vorhersagen auf numerischen Wetterprognosen (NWP), denen physikalische Gleichungen zu Grunde liegen. Die wiederum werden in Computeralgorithmen übersetzt und laufen auf Supercomputern. Dieser traditionelle Ansatz erfordert viel Zeit und tiefe Kenntnisse sowie nicht unerhebliche Rechenkapazitäten für annähernd präzise Vorhersagen. Künstliche Intelligenz soll die Wettervorhersage nun beschleunigen und vor allem treffsicherer machen.
Im Sommer 2023 hatten zwei neue Algorithmen das große Potenzial gezeigt, das KI als Wetterfrosch besitzt – zudem benötigt die KI-gestützte Vorhersage offenbar kaum meteorologisches Verständnis. Nun hat Googles KI-Forschungsabteilung DeepMind ein neues Wettermodell vorgelegt, das die bisherigen Fortschritte auf dem Gebiet erneut toppen soll: GraphCast benötigt laut seinen Herausgebern weniger Zeit und Rechenkraft als bisherige Modelle. Das neue Wettermodell wurde mit historischen Wetterdaten trainiert und bezieht sich für die Vorhersagen auf die aktuelle Datenlage. Dem Blogeintrag des DeepMind-Teams zufolge soll das Modell präzise Zehn-Tages-Prognosen in weniger als einer Minute ausgeben.
Zum Vergleich: Bei den im Sommer präsentierten Algorithmen aus chinesischen KI-Laboren in Peking und Shenzhen lag die Höchstleistung bei etwa sieben Tagen Prognosezeitraum und Niederschlagsvorhersagen von etwa drei Stunden im Voraus. Dafür waren auch deutlich längere Rechenzeiten nötig, als nun von den Google-Forschern angegeben werden. Sollten die Angaben von Google DeepMind stimmen, wäre das veröffentlichte Modell derzeit ein neuer »Goldstandard« auf dem Gebiet der KI-gestützten Wetterprognose – wobei solche Zuschreibungen angesichts rasanter Fortschritte in der KI-Forschung meistens nicht lange vorhalten.
Das neue Wettermodell funktioniert im Grunde so, wie man es von Modellen generativer KI gewohnt ist: GraphCast sagt zum eingegebenen Ist-Zustand den wahrscheinlichsten nächsten Zustand voraus und greift für die Vorhersage auf die eintrainierten Muster aus den historischen Daten zurück. Als Eingabe benötigt das Modell lediglich zwei Angaben: das Wetter von vor sechs Stunden und die gegenwärtige Wetterlage. Auf dieser Basis ist das KI-System in der Lage, das Wetter in sechs Stunden vorherzusagen. Der Vorgang dieser schichtweisen Prognose lässt sich etliche Male wiederholen und führt zu Vorhersagen, die bis zu zehn Tage in die Zukunft schauen. Das Europäische Zentrum für mittelfristige Wettervorhersage (ECMWF) experimentiert bereits mit der Zehn-Tages-Prognose von GraphCast, ist dem Blogeintrag der Forscher zu entnehmen. Das ECMWF stellte auch die historischen Wetterdaten bereit, mit denen das Modell trainiert wurde. Die in das Training von GraphCast eingeflossenen Daten umspannen vier Jahrzehnte an historischen Wetterbeobachtungen von Satellitenbildern, Radaraufzeichnungen und Daten von Wetterstationen weltweit.
Extremwetter früher erkennen
Neben alltäglichen Wettervorhersagen kann GraphCast seinen Herausgebern zufolge auch extreme Wetterereignisse früher erkennen als die traditionellen Wettermodelle – obwohl es dafür kein Spezialtraining durchlaufen hat, wie die Forscherinnen und Forscher betonen. Unter anderem lässt sich ein Wirbelsturm-Tracker in die Vorhersagen einbinden. Die Forscher wollen damit im Untersuchungszeitraum einen Wirbelsturm genauer vorhergesagt haben als die HRES-Modelle der offiziellen Wetterstationen. Im September 2023 habe eine Liveversion des öffentlich verfügbaren Modells auf der ECMWF-Website den Hurrikan Lee und dessen »Landgang« in der kanadischen Provinz Nova Scotia neun Tage im Voraus präzise vorausgesagt. Andere Modelle wiesen demgegenüber eine größere Varianz auf und blieben länger unsicher, wo genau der Wirbelsturm auf Land treffen würde. Dass der Hurrikan Nova Scotia treffen würde, konnten sie erst sechs Tage im Voraus ankündigen – drei Tage nach dem neuen KI-basierten Modell.
Neben dem Weg, den ein Wirbelsturm nimmt, soll das Modell auch atmosphärische Strömungen und deren Potenzial für Starkregen mit Überschwemmungen recht präzise einschätzen können. Zudem soll es Fortschritte in der Vorhersage von Extremtemperaturen und Hitzewellen gegenüber den bisherigen Vorhersagewerkzeugen bringen.
Das Modell verstärkt die Modellfamilie der beiden Google-Forschungslabore DeepMind und Google Research, die zuvor bereits ein Modell namens »Nowcasting« für 90-Minuten-Vorhersagen veröffentlicht hatten sowie »MetNet-3«, ein Wettervorhersagemodell, das in den USA und in Europa bereits recht treffsichere 24-Stunden-Vorhersagen liefert. Die bisherigen Modelle waren auf regionales Wettergeschehen beschränkt, GraphCast hingegen soll weltweite Wetterdaten verarbeiten und ausgeben.
KI-Wetterfrosch für daheim
Das Forschungsteam hinter GraphCast hat seine Ergebnisse im Fachmagazin »Science« veröffentlicht und teilt auch den Quellcode des neuen Hochpräzisionsmodells mit der Forschungsgemeinschaft. Der Programmcode, die zum Betreiben nötigen Bibliotheken, eine Demo und weitere Hinweise sind im GraphCast-Repository bei GitHub öffentlich abrufbar. Das Verzeichnis listet drei Modellversionen auf, die die Daten in unterschiedlich hohen beziehungsweise niedrigen Auflösungen vorhalten. Wer nur über beschränkte Rechenkapazitäten verfügt, kann somit auch auf eine kleinere Modellversion mit geringerer Auflösung und etwas geringerem zeitlichen Referenzrahmen zugreifen, um so auch mit weniger Rechenkraft Vorhersagen erzeugen zu lassen.
Die drei veröffentlichten Modelle unterscheiden sich hinsichtlich des Trainingsumfangs: Das Standardmodell GraphCast diente als Grundlage des Forschungsberichtes bei »Science« und wurde mit historischen Wetterdaten von 1979 bis 2017 gefüttert, GraphCast_small reicht nur bis 2015 (bei geringerer Auflösung), während das größte Modell Graphcast_operational ein Feintuning auf Daten von 2016 bis 2021 erhalten hat. Das letztgenannte Modell soll direkt einsatzfähig sein.
Die zum Betrieb ebenfalls nötigen Modellgewichte, statistische Daten und Eingabebeispiele stellt Google DeepMind in einem »Bucket« (Behälter) innerhalb der Google-Cloud bereit. Bei den Modellgewichten handelt es sich um die im Training eines Machine-Learning-Modells gelernten gewichtenden Parameter, die später die Stärke des Signals zwischen den Neuronen des künstlichen neuronalen Netzes steuern. Sie bestimmen, wie stark oder schwach eine Eingabe in Bezug auf das auszugebende Ergebnis zu gewichten ist.
Für den Zugang zur Google-Cloud ist ein aktives Google-Konto erforderlich. Wer das Modell auf eigenen Rechnern nachtrainieren möchte oder eigene Modelle nach den »Kochrezepten« des Forschungsberichtes von der Pike auf erstellen will, müsste zuvor einen speziellen Datensatz namens »ERA5« vom ECMWF herunterladen – dafür ist eine Anmeldung beim ECMWF zwingend erforderlich und offenbar auch eine Nutzungslizenz. Zum reinen Austesten genügen jedoch die auf GitHub und bei Google bereitgestellten, frei verfügbaren Modelldaten, in die bereits ECMWF-Datensätze beim Vortraining eingegangen sind.
Der Wettbewerb um die besten KI-Wetterprognosen findet zwischen chinesischen und US-amerikanischen Forschungseinheiten statt
Kleinere Demos, wie die Vorhersagen des Modells funktionieren und aussehen, präsentiert auch der Blogeintrag des DeepMind-Teams in Form von Grafiken und GIF-Animationen.
An den Ursprungslaboren der derzeit mutmaßlich leistungsfähigsten KI-basierten Wettermodelle lässt sich nebenbei auch ablesen, wer die Nase vorn hat im weltweiten KI-Rennen: Der eigentliche Wettbewerb um das Siegertreppchen wird oft zwischen chinesischen und US-amerikanischen Forschungseinheiten ausgetragen, die in der Regel finanziell und hinsichtlich der erforderlichen Hardware-Ressourcen deutlich besser ausgestattet sind als europäische Mitbewerber etwa aus dem akademischen Bereich oder von universitätsnahen Forschungseinrichtungen.
Wenn Sie inhaltliche Anmerkungen zu diesem Artikel haben, können Sie die Redaktion per E-Mail informieren. Wir lesen Ihre Zuschrift, bitten jedoch um Verständnis, dass wir nicht jede beantworten können.