Eine Geschichte der KI
Digitalisierung – dieser Begriff beherrscht schon seit einigen Jahren öffentliche Diskussionen. So ist es auch nicht verwunderlich, dass er in den Bundestagswahl-Programmen der großen Parteien vielfach auftaucht. Überraschend aber doch, dass selbst die beiden Schlüsselworte des Buchtitels, »Algorithmen« und »künstliche Intelligenz«, darin zu finden sind.
Reiner Hype?
Der vom Verlag als »mathematisches Wunderkind« apostrophierte junge Autor (Jahrgang 1998, mit einem Studienabschluss in Philosophie und einer Promotion in Mathematik) ist der Auffassung, die Berichterstattung über künstliche Intelligenz (KI) sei teilweise übertrieben, ja »reiner Hype«, und führt das auf die undurchsichtige Technik zurück, die der KI zu Grunde liegt. So will er uns in seinem Buch eine Vorstellung davon vermitteln, »wie künstliche Intelligenz funktioniert«. Dass er da weit bis ins 19. Jahrhundert zu Charles Babbage und seiner »Programmiererin« Ada Lovelace zurückgeht, verwundert – diese historische Reminiszenz ist wohl eher der Tatsache geschuldet, dass Ada im Buchtitel auftritt.
Um die großen Veränderungen in diesem Bereich richtig einordnen zu können, unterscheidet der Autor die informelle Mathematik (wie er sie bezeichnet), so wie Ingenieure oder Betriebswirte sie im Alltag benutzen, von der formalen Mathematik mit ihren abstrakten Postulaten, Regeln und Aussagen, wie sie als Wissenschaft betrieben wird. Denn »der formale Charakter der Mathematik bestimmt die Art und Weise, wie sich künstliche Intelligenz entwickelt hat«.
Diese regelbasierte künstliche Intelligenz prägte die ersten Jahrzehnte der Entwicklung. Beispiele für diese frühen Ansätze zeigt der Verfasser anhand eines medizinischen Expertensystems und des scheinbar natürliche Sprache verstehenden Computerprogramms »Eliza« von Joseph Weizenbaum. Diese Art von Software blieb bis in die 1990er Jahre hinter den hochgespannten Erwartungen zurück, auch wenn sie mit dem Schachprogramm Deep Blue, das den Weltmeister 1997 schlug, einen »letzten Höhepunkt des traditionellen Ansatzes der KI« erreichte.
Den Großteil des Buchs nehmen moderne Verfahren ein, die auf künstlichen neuronalen Netzen basieren. Mit ihnen versuchen sich die Entwickler von den mathematischen Regeln zu entfernen und »Computer stattdessen auf eine für uns intuitivere Art lernen zu lassen«. An dem einfachen Beispiel der Erkennung handgeschriebener Ziffern erläutert der Autor, wie das prinzipiell funktioniert: Der Computer wird mit Millionen handgeschriebener Zahlen gefüttert sowie mit der digitalen Entsprechung. Bei diesem Prozess entwickelt die Software ihre eigenen Regeln, identifiziert Muster und lernt selbstständig an den Beispielen. Nach Ende der Trainingsphase erkennt das neuronale Netz eine Ziffer mit extrem hoher Sicherheit.
Das neuronale Netz besteht aus Eingabe-Neuronen, welche die Pixel des Ziffernbilds registrieren, und Ausgabe-Neuronen, die das Ergebnis liefern. Dazwischen liegen verborgene Schichten, die mit Hilfe mathematischer Methoden das Ergebnis berechnen. Die Methoden erklärt der Autor nur exemplarisch und kurz mit dem so genannten »Gradientenabstieg«, im Übrigen geht er auf die zu Grunde liegende Mathematik nicht ein.
Danach leitet Buijsman über zur allgemeinen Mustererkennung in Bildern, Fotos und Texten. Neuronale Faltungsnetze (englisch: convolutional neural networks, kurz CNN) versuchen dabei, die Funktionsweise des Gehirns zu imitieren. Auch für die Verarbeitung natürlicher Sprache in Wort und Schrift lernt man die neuesten Typen neuronaler Netze kennen, die in den letzten Jahren entwickelt wurden – häufig von den Forschungsabteilungen großer Firmen wie Amazon, Apple und Google. Programme, die Gesprochenes in Schrift umwandeln und Rede oder Text in eine andere Sprache übersetzen, sind heute durch die neuen Smartphones weithin bekannt. Dieser Fortschritt ist auf zwei wesentliche Gründe zurückzuführen. Zum einen verfügen die Konzerne über riesige Mengen an Daten, die sie als Trainingsmaterial für die neuronalen Netze verwenden können und die wir alle ihnen freiwillig und kostenlos liefern. Zum anderen hat sich die Rechenleistung der Computer immens vergrößert, wodurch die Software auf ein großes »Gedächtnis« zurückgreifen kann.
Auch für die kreative Erzeugung und Manipulation von Fotos und Videos haben Fachleute 2014 neuartige neuronale Netze entwickelt (generative adversarial networks, kurz GANs). Sie umfassen, vereinfacht ausgedrückt, zwei Programmteile, wobei einer den anderen kontrolliert. Diese Netze können frei erfundene Porträtfotos erzeugen, kurze Videoclips aus einem einzigen Foto herstellen oder gar Kunstwerke wie Gemälde oder Kompositionen schaffen (das Porträt eines fiktiven Mannes wurde 2018 vom Aktionshaus Christie's für 432 500 US-Dollar versteigert).
»Geschichten«, wie im Untertitel des Buchs angekündigt, findet man auch – vor allem wenn der Autor über Fehler, Fehlleistungen und misslungene Verfahren berichtet. Aus diesen Mängeln haben die Entwickler, wie Buijsman immer wieder hervorhebt, eine wesentliche Erkenntnis gewonnen: »Neuronale Netze (…) sind fragil, wenn man sie für etwas einsetzt, das von ihren Trainingsdaten abweicht.«
Der Autor streut immer wieder Überlegungen ein, in denen er in Frage stellt, wie die teils enthusiastischen Bewertungen solcher Produkte zu beurteilen sind. Handelt es sich bei Computerkunstwerken wirklich um Kunst? Können Computer nicht nur einfache Sachtexte, sondern wirklich literarische Werke erzeugen, oder sind das nur Imitationen? Wie unterscheidet sich unser Gehirn von einem neuronalen Netz – woran fehlt es Computern? Der Autor bleibt dabei vorsichtig. Seiner selbst gestellten Frage »Sind Computer zu einer Sprache ohne Bedeutung verdammt?« gibt er die Antwort: »Ich bin verhalten optimistisch, dass Computer eines Tages die Bedeutung ihrer Sprache verstehen werden.« Aber auch diese Aussage bezweifelt er einige Absätze später wieder und kommt abschließend zum Fazit: »Von allgemeiner künstlicher Intelligenz sind wir noch weit entfernt.«
Das Buch enthält viele Abbildungen, die leider teilweise klein und meistens nur in Graustufen abgedruckt sind, so dass die Sichtbarkeit leidet. Auch die Zuordnung eines Bilds zum zugehörigen Text ist nicht immer klar. Bemerkenswert sind hingegen die vielen abgedruckten QR-Codes, mit denen man die verschiedensten Quellen im Internet aufrufen kann, die im Buch enthaltenen Abbildungen, Youtube-Videos sowie wissenschaftliche Artikel. Das über 20 Seiten umfassende Literaturverzeichnis ist sorgfältig zusammengestellt, nach Sachgebieten gegliedert und ermöglicht es daher, sich weitere Informationen zu verschaffen. Noch hilfreicher wäre es gewesen, wenn allgemein verständliche Publikationen im Unterschied zu fachwissenschaftlichen hervorgehoben wären.
Laien gibt das Buch den hochaktuellen Forschungsstand der KI ausführlich wieder, erfordert allerdings teilweise intensives Mitdenken und eine zusätzliche Beschäftigung mit den angegebenen Quellen. Wer sich schon ein wenig mit der Materie auskennt, wird sicher von den zusätzlichen Verweisen profitieren.
Schreiben Sie uns!
1 Beitrag anzeigen