Direkt zum Inhalt

Neuroinformatik: Automatische Bilderkennung wird überschätzt

Maschinelle Objekterkennung
Die Leistung von Computerprogrammen beim Erkennen von Objekten wird überschätzt, kritisieren Forscher um James DiCarlo vom Massachussetts Institute of Technology. Rechnersoftware sei bei Tests zur Katergorisierung nicht selten bevorteilt, da die Objekte auf oft eingesetzten Standardfotos im Bildvordergrund, mittig und frontal präsentiert werden [1].

Variabler und damit realitätsnäher dargestellte Objekte ließen die Leistungen der Maschinenaugen hingegen deutlich hinter die des menschlichen Sehsinns zurückfallen. Um die Funktion des Gehirns verstehen und simulieren zu können, müssen die experimentellen Standards deshalb besser der Wirklichkeit angepasst werden, fordern die Wissenschaftler.

Neuroinformatiker hatten in den vergangenen Jahren große Fortschritte bei der Modellierung der Objekterkennung verkündet. Die Simulation des Sehvorgangs durch Computer ist Voraussetzung für ehrgeizige Forschungsziele wie intelligente Autos ohne Fahrer und Sehprothesen für Blinde.

Wie sich die automatische Bilderkennung verbessern ließe – zumindest bei Gesichtern –, demonstrieren Rob Jenkins und Mike Burton von der Universität Glasgow mit Fotos von Prominenten: Als sie aus mehreren Aufnahmen eine "gemittelte" Ansicht erstellten, schnellte die Wiedererkennungsrate der eingesetzten Software von zuvor knapp über fünfzig auf hundert Prozent [2].

Die Forscher nutzten das Webangebot MyHeritage, eine Bilderdatenbank, in der unter anderem persönliche Fotos hochgeladen werden können. Die Bilder werden mit Gesichtserkennungssoftware gescannt und beispielsweise auf Ähnlichkeit mit Prominenten geprüft. Als Jenkins und Burton jedoch eigene Aufnahmen von in der Datenbank vertretenen Berühmtheiten einsetzten, erkannte das Programm nur in 54 Prozent der Fälle, wen es vor sich hatte.

Gesichtserkennung auf neuen Wegen | Rob Jenkins mit seinem Passbild (links) und einer zusammengeschnittenen Aufnahme aus mehreren Bildern (rechts): Die Wiedererkennungsrate lag bei dem "gemittelten" Gesicht deutlich höher.
Erst als die Wissenschaftler aus mehreren Bildern ein "Durchschnittsbild" der jeweiligen Person erstellten, wurde sie zuverlässig vom System erkannt. Selbst als sie Fotos verwendeten, die das Programm zuvor einzeln nicht richtig eingeordnet hatte, lag die Trefferquote bei den daraus zusammengeschnittenen Varianten schließlich bei achtzig Prozent.

Offenbar sorge das Mitteln der Bildinformationen dafür, dass störende und nebensächliche Eigenheiten herausgefiltert werden und nur charakteristische und damit hilfreiche Merkmale vergleichsweise stark hervortreten. Sie schlagen daher vor, dass beispielsweise Fotos im Personalausweis aus solchen zusammengeschnittenen Aufnahmen bestehen sollten. (pm/af)

[1] Public Library of Science Computational Biology 4(1): e27 (2008), Volltext
[2] Science 319: 435 (2008), Abstract


©spektrumdirekt

Schreiben Sie uns!

Wenn Sie inhaltliche Anmerkungen zu diesem Artikel haben, können Sie die Redaktion per E-Mail informieren. Wir lesen Ihre Zuschrift, bitten jedoch um Verständnis, dass wir nicht jede beantworten können.

Partnerinhalte

Bitte erlauben Sie Javascript, um die volle Funktionalität von Spektrum.de zu erhalten.