Die fabelhafte Welt der Mathematik: Mit der Entdeckung von Ceres schuf Gauß die Grundlage für KI
Als Giuseppe Piazzi am Neujahrstag 1801 in die Sterne blickte, entdeckte er etwas Seltsames. Der Priester hatte in den vorigen Monaten den Nachthimmel studiert, so dass ihm der zusätzliche Lichtpunkt schnell auffiel. Und er schien sich nicht mit den anderen Fixsternen zu bewegen. Somit war klar: Der beobachtete Himmelskörper konnte kein Stern sein. Das war eine aufregende Entdeckung, denn viele Astronomen dieser Zeit hatten sich über die große Lücke zwischen Mars und Jupiter gewundert; sie erwarteten dort einen noch unbekannten Planeten.
40 Tage lange beobachtete Piazzi den Lichtpunkt und notierte die Koordinaten und die Uhrzeit, zu denen er Ceres (wie er ihn nannte) sah. Doch dann verschwand der Himmelskörper hinter der Sonne – und sollte dort mehrere Monate versteckt bleiben. In dieser Periode wäre Ceres nur tagsüber am Himmel zu sehen, doch das helle Sonnenlicht machte eine Beobachtung unmöglich. Deshalb versuchten verschiedene Fachleute aus den wenigen verfügbaren Daten, die Piazzi gesammelt hatte, den weiteren Verlauf von Ceres zu berechnen. Sie wollten herausfinden, welchen Teil des Nachthimmels sie absuchen mussten, um den Himmelskörper nach mehreren Monaten des Versteckspiels wiederzufinden.
Doch diese Aufgabe erwies sich als sehr schwierig. Den Forschern standen 22 Messpunkte zur Verfügung, die Piazzi aufgenommen hatte. Sie deckten aber gerade einmal ein Prozent der Laufbahn von Ceres ab. Zudem waren die Daten mit Messfehlern behaftet. Piazzis Beobachtungen waren nicht exakt, ebenso wenig wie die Methoden, mit denen er die Position des Himmelskörpers bestimmte. Auch die atmosphärischen Bedingungen verfälschen ein Ergebnis. Manche Astronomen ließen sich davon nicht entmutigen und versuchten trotzdem, die ellipsenförmige Bahn von Ceres mit diesen ungenauen Daten zu bestimmen. Andere Fachleute, darunter Pierre Simon Laplace, hielten das Problem seinerzeit für unlösbar.
Es gelang dem damals 24-jährigen Carl Friedrich Gauß, den Verlauf von Ceres korrekt vorherzusagen. Er gab eine Position am Himmel an, bei welcher der Himmelskörper wieder in Erscheinung treten sollte. Sein Ergebnis unterschied sich stark von allen anderen – und doch lag Gauß richtig. Für diese Aufgabe entwickelte der Mathematiker völlig neue Methoden, die auch heute noch breite Anwendung finden: Unter anderem dient Gauß' Technik als Grundlage für KI-Algorithmen.
Eine Gleichung mit Unbekannten lösen
Da Piazzi Ceres nur über wenige Tage beobachten konnte, besaß Gauß kaum Informationen über die Form der Umlaufbahn. Er wusste, dass alle Planeten – oder wie in diesem Fall, Asteroiden – einer ellipsenförmigen Bahn folgen, mit der Sonne in einem Brennpunkt. Die Bahnkurve hängt von sechs Parametern ab, die Gauß unbekannt waren: das Aphel a (der sonnenfernste Punkt auf der Bahn), die Exzentrizität e (die angibt, wie stark die Ellipse von einem Kreis abweicht), die Bahnneigung i, die Länge des aufsteigenden Knotens Ω, das Argument der Periapsis ω sowie die mittlere Winkelgeschwindigkeit der mittleren Anomalie M. Da Gauß diese sechs Größen nicht kannte, musste er sie anpassen, damit sie möglichst gut zu Piazzis aufgezeichneten Messpunkten passen.
Solche Aufgaben kommen Ihnen vielleicht noch aus Ihrer Schulzeit bekannt vor. Eine typische Mathematikaufgabe besteht darin, herauszufinden, welche Gerade durch zwei vorgegebene Punkte verläuft, etwa P1 = (1, 1) und P2 = (3, 2). Dafür geht man meist folgendermaßen vor: Eine Geradengleichung hat die Form y = m·x + b, wobei m die Steigung bezeichnet und b den y-Achsenabschnitt. Nun kann man zuerst die x- und y-Koordinaten des Punkts P1 in die Geradengleichung einsetzen: 1 = m + b. Man hat also eine Gleichung mit zwei Unbekannten. Anschließend kann man die Gleichung mit den Koordinaten von P2 füttern und erhält entsprechend: 2 = 3m + b. Damit hat man zwei Gleichungen mit zwei Unbekannten. Indem man sie ineinander einsetzt, lassen sich die Werte m und b der Geraden bestimmen, die durch die zwei Punkte P1 und P2 verläuft.
Um eine Gleichung mit zwei Unbekannten lösen zu können, braucht man also zwei Datenpunkte. Da Gauß es mit einer Ellipsengleichung zu tun hatte, die von sechs Parametern abhängt, brauchte er entsprechend sechs. Und die waren in drei Messdaten erfasst (da Piazzi mit jeder Messung zwei Werte notierte). Von den 22 Messwerten brauchte Gauß also theoretisch nur drei Stück. Er entschied sich zunächst für drei Datenpunkte, die zeitlich einen möglichst großen Abstand hatten, also untersuchte er die Messungen vom 2. Januar, vom 22. Januar und vom 11. Februar 1801.
Damit erhielt er zwar ein Ergebnis, aber kein besonders gutes. Denn mit echten Messpunkten ist das Vorgehen nicht so einfach. Denn die Daten sind nicht exakt, sondern enthalten Fehler. Wenn man zum Beispiel messen möchte, wie schnell eine Badewanne vollläuft, kann man zu verschiedenen Zeiten den Wasserstand bestimmen. Falls das Wasser gleichmäßig aus dem Wasserhahn strömt, sollte das Wasser linear mit der Zeit steigen. Doch die Messwerte werden in der Regel nicht exakt eine Gerade bilden, sondern leicht davon abweichen. In einem solchen Fall besteht die Herausforderung darin, eine Gerade zu finden, die bestmöglich zu allen Messungen passt.
Wie man Messfehler berücksichtigt
Gauß hatte sich schon im Alter von 18 Jahren Gedanken darüber gemacht, wie man eine passende Modellfunktion bestimmen kann, wenn ein ungenauer Datensatz vorliegt. Dabei entwickelte er die »Methode der kleinsten Quadrate«, die es erlaubt, Datenpunkte möglichst präzise durch eine Modellfunktion abzubilden. Im Fall einer Geraden besteht das Problem also darin, anhand mehrerer Messwerte (xi, yi) eine Gleichung der Form f(x) = m·x + b zu bestimmen, deren Parameter m und b so gewählt sind, damit f optimal zu den Messwerten passt.
Um zu bestimmen, wie gut das für eine Modellfunktion f der Fall ist, kann man das »Residuum« ri messen: ri = yi −f(xi). Das Residuum entspricht also der Abweichung des Modells f von einem tatsächlichen Messwert yi. Die Methode der kleinsten Quadrate verlangt, dass man die Parameter so anpasst, damit die Summe der quadrierten Residuen möglichst klein bleibt: ∑iri2.
Das Quadrieren hat mehrere Vorteile. Zum einen spielt es dann keine Rolle, ob das Residuum ein positives oder negatives Vorzeichen hat. Zum anderen führt es dazu, dass große Abweichungen von einem Messwert stärker ins Gewicht fallen als kleinere. Wie Gauß 1822 bewies, liefert die Methode der kleinsten Quadrate in einigen Fällen das optimale Ergebnis.
Methode der kleinsten Quadrate
Die von Gauß entwickelte Methode lässt sich an einem konkreten Beispiel veranschaulichen. Angenommen, man möchte einen linearen Zusammenhang von vier Messpunkten bestimmen, etwa (1, 6), (2, 5), (3, 7) und (4, 10). Dann muss man die vier Punkte zuerst in die Geradengleichung f(x) = m·x + b einsetzen:
6 = m + b
5 = 2m + b
7 = 3m + b
10 = 4m + b
Zu diesen vier Gleichungen gibt es keine exakte Lösung, weil die vier Punkte nicht auf einer Geraden liegen. Daher muss man versuchen, die bestmögliche Gerade zu finden, die diesen Punkten entspricht. Dafür führt man vier Residuen r1, r2, r3 und r4 ein, die folgendermaßen definiert sind: ri = yi − f(xi). In die vier Gleichungen eingesetzt erhält man:
r1 = 6 – (m + b)
r2 = 5 – (2m + b)
r3 = 7 – (3m + b)
r4 = 10 – (4m + b)
Gauß' Methode der kleinsten Quadrate besagt, dass die Summe S der quadrierten Residuen möglichst klein werden soll: S = (6 – (m + b))2 + (5 – (2m + b))2 + (7 – (3m + b))2 + (10 – (4m + b))2. Indem man die Terme auflöst und vereinfacht, findet man folgendes Ergebnis: S = 4b2 + 30m2 + 20mb – 56b – 154m + 210.
Nun muss man die Parameter b und m so wählen, dass die Summe S minimal wird. Dafür kann man S je einmal nach m und einmal nach b ableiten und null setzen. Wenn man das durchrechnet, ergibt sich, dass S den kleinstmöglichen Wert für m = 1,4 und b = 3,5 annimmt. Die Gerade, die am besten zu den Messwerten passt, erfüllt also die Gleichung: f(x) = 1,4x + 3,5.
Indem Gauß auch weitere Datenpunkte berücksichtigte, die Piazzi gesammelt hatte, konnte er seine Methode der kleinsten Quadrate nutzen, um die ellipsenförmige Bahn von Ceres zu bestimmen. Doch das stellte sich als echte Mammutaufgabe heraus. Zur damaligen Zeit standen ihm keine Computer oder sonstige Rechenmaschinen zur Verfügung, so dass er die Berechnungen mühsam von Hand ausführte. Drei Monate verbrachte er mit den kleinteiligen Kalkulationen, bis er schließlich ein Ergebnis erhielt.
Damit konnte Gauß vorhersagen, wo im Nachthimmel Ceres während des Zeitraums vom 25. November bis 31. Dezember 1801 erscheinen würde. Erstaunlich war, dass der junge Forscher ein ganz anderes Ergebnis erhielt als seine Kollegen. Es hatten sich auch Astronomen an der schwierigen Aufgabe versucht – jedoch mit anderen Ansätzen als Gauß. Sie trafen Annahmen, was die Exzentrizität und andere Parameter der ellipsenförmigen Bahn betraf. Ihre Arbeiten sagten Ceres in einem Bereich des Himmels voraus, der um etwa sechs Grad von Gauß' prognostizierter Position abwich (was etwa einer Abweichung von einem Dutzend Monddurchmessern entspricht).
Der Astronom Franz Zaver von Zach konnte das Ergebnis von Gauß im Dezember 1801 bestätigen. Der junge, bis dahin wenig bekannte Forscher Gauß hatte mit seiner Prognose Recht gehabt. Auf diese Weise konnte die Existenz von Ceres nachgewiesen werden, dem größten Asteroiden zwischen Mars und Jupiter. Damit hatte Gauß die Grundlage der Datenwissenschaft gelegt – und die Basis des maschinellen Lernens.
Denn im Prinzip tut eine künstliche Intelligenz nichts anderes als das, was Gauß drei Monate lang beschäftigte – nur in wesentlich aufwändigerer Form. Um ein KI-Programm zum Laufen zu bringen, muss man es mit etlichen Daten füttern (das so genannte Training). Man übergibt dem Programm also Trainingsdaten (xi, yi), ähnlich den Messwerten von Piazzi, die Gauß zur Verfügung standen. Der Algorithmus versucht dann, die zahlreichen Parameter einer extrem komplizierten Funktion f(xi) anzupassen, damit sie die Werte yi möglichst gut reproduziert. Die meisten Algorithmen setzen dafür nicht mehr auf die Methode der kleinsten Quadrate, aber der Grundgedanke ist stets ein ähnlicher.
Wann immer Sie sich also mit ChatGPT unterhalten, eine Google-Suchanfrage machen oder eine Filmempfehlung von Netflix wahrnehmen, können Sie daran denken: Die Grundlagen für diese Technologien setzte Gauß zu Beginn des 19. Jahrhunderts, als er die Umlaufbahn von Ceres untersuchte.
Sie haben auch ein Lieblingsthema zu Mathematik und würden gerne mehr darüber in dieser Kolumne lesen? Dann schreiben Sie es mir gerne in die Kommentare!
Schreiben Sie uns!
1 Beitrag anzeigen