Künstliche Intelligenz: KI-Drohne besiegt menschliche Konkurrenz
Das autonome System »Swift« ist darauf trainiert, menschliche Weltmeister in einem Flugwettkampf zu besiegen. Im Juni 2022 wurde es in einem Drohnenrennen auf die Probe gestellt: In einem Hangar des Flughafens Dübendorf bei Zürich trat Swift gegen drei Champions in diesem Gebiet an und gewann mit einer halben Sekunde Vorsprung. Die Ergebnisse und technischen Details hinter dem Erfolg hat das Team um Ingenieur Elia Kaufmann von der Universität Zürich nun im Fachjournal »Nature« veröffentlicht.
Beim Training von Maschinen, die menschliche Kontrahenten in einer Disziplin schlagen sollen, kommt eine bestimmte Art von maschinellem Lernen zum Einsatz. Beim so genannten Reinforcement Learning (RL, deutsch: bestärkendes oder verstärkendes Lernen) wird eine künstliche Intelligenz (KI) einem Problem ausgeliefert und muss selbstständig eine Strategie entwickeln, um es auf optimale Weise zu lösen. Wie bei einem Kind, das Fahrradfahren lernt und stürzt, erfährt die KI aus der Interaktion mit ihrer Umgebung, welche Bewegungen zielführend sind und welche sie vermeiden sollte.
Ein erweiterter Zweig dieser Art von maschinellem Lernen ist das Deep RL, das Gebrauch von neuronalen Netzwerken macht. Diese orientieren sich an der Struktur des menschlichen Gehirns und imitieren die Kommunikation von Neuronen untereinander. Mit Deep RL gelangen Aufsehen erregende Erfolge: Die künstliche Intelligenz AlphaGo von Google besiegte 2016 den damaligen Champion Lee Sedol in Go, einem komplexen chinesischen Brettspiel. Bereits 1996 behauptete sich die KI Deep Blue von IBM in einem Schachspiel von 1997 gegen Garri Kasparow, nachdem dieser Deep Blue ein Jahr zuvor noch geschlagen hatte. Auch in modernen Spielen wie StarCraft oder Dota 2 werden Menschen immer wieder von Maschinen übertroffen.
Swift wurde ebenso mit Deep RL trainiert. Um nicht direkt am Anfang der Trainingsphase Drohnen zu zerstören, lernte Swift das Fliegen zunächst in simulierten Umgebungen. Eine Kamera liefert dem System die Informationen aus der Umgebung, auf die es in Echtzeit reagieren muss. Ein Sensor misst analog zum menschlichen Gleichgewichtsorgan die momentane Beschleunigung und Geschwindigkeit. Mit diesen Informationen entscheidet die Steuereinheit der KI-Drohne, welche Handlung als Nächstes durchzuführen ist, um die Flugstrecke schnellstmöglich zu absolvieren.
Der von der Schweizer Forschungsgruppe aufgestellte Hindernisparcours maß eine Länge von 75 Metern und beinhaltete sieben Tore, durch welche die drei menschlichen Profis und Swift in richtiger Reihenfolge fliegen mussten. Thomas Bitmatta, Marvin Schäpper und Alex Vanover, Champions im First-Person-View-Drohnenrennen, durften zuvor eine Woche lang auf der Strecke trainieren, um sich auf den Kampf gegen die maschinelle Konkurrenz vorzubereiten. Am Tag des Wettkampfs traten die Champions dann in zahlreichen Kopf-an-Kopf-Rennen gegen die KI an.
Im Großen und Ganzen schnitt Swift besser als seine Gegner ab und verzeichnete 15 Siege sowie 10 Niederlagen. Außerdem gelang es der KI-Drohne, in einer Runde die schnellste Zeit zu erreichen, mit einer halben Sekunde Vorsprung vor Alex Vanover. Interessanterweise war Swift auf der gesamten Strecke zwar schneller, aber nicht auf den individuellen Teilstrecken. Das Forschungsteam vermutet, dass die KI gelernt hat, ihre Zeit im gesamten Rennen zu optimieren, während die menschlichen Piloten versuchen, zu Beginn und am Ende eines Manövers Tempo zu machen. Swift ist zudem in engen Kurven und am Anfang des Rennens schneller und wendet sich erst später dem nächsten Tor zu als seine Mitstreiter. Womöglich orientiert sich die KI eher an den Daten des Sensors als an den Kamerabildern, wenn sie sich für die optimale Flugbahn entscheidet.
Zwar konnte Swift die menschlichen Kontrahenten nicht in allen Rennen besiegen. Dennoch beweist der Wettbewerb, wie weit die Entwicklung schneller und wendiger autonomer Drohnen vorangeschritten ist. Die Studie zeigt aber auch: Insbesondere bei überraschenden Situationen, die das System nicht trainieren konnte, ist die menschliche Anpassungsfähigkeit überlegen – zumindest noch.
Wenn Sie inhaltliche Anmerkungen zu diesem Artikel haben, können Sie die Redaktion per E-Mail informieren. Wir lesen Ihre Zuschrift, bitten jedoch um Verständnis, dass wir nicht jede beantworten können.