Suchmaschine Google: 'Qualität der Suchergebnisse ist unser höchstes Ziel'
Monika Henzinger, die Leiterin der Forschungsabteilung von Google in Mountain View (Kalifornien), äußert sich zum Erfolgsrezept der beliebtesten Suchmaschine.
Spektrum der Wissenschaft: Frau Henzinger, wie viele Seiten des World Wide Web erschließt Google heute?
Monika Henzinger: Wir haben über zwei Milliarden Webseiten in unserer Datenbank. Hinzu kommen 700 Millionen Newsgroup-Beiträge, die weit in die Vergangenheit reichen, und 300 Millionen Bilder.
Spektrum: Und diese Inhalte haben Sie komplett gespeichert?
Henzinger: In komprimierter Form, ja.
Spektrum: Ist das nicht schon das gesamte Web?
Henzinger: Bei weitem nicht! Eigentlich ist das Web unendlich. Es gibt Datenbanken, die beliebig viele Webseiten auf Anfrage erzeugen können. Natürlich macht es keinen Sinn, die alle in der Suchmaschine zu haben. Wir beschränken uns auf Seiten hoher Qualität.
Spektrum: Wie wählen Sie die aus?
Henzinger: Nach dem so genannten PageRank. Das ist eine Note, die wir jeder Seite geben, unabhängig von irgendeiner Anfrage, für die diese Seite relevant sein könnte. Und zwar ist die Qualität einer Seite – oder anders gesagt: die Hochachtung, die sie innerhalb des Web genießt – umso größer, je mehr andere Seiten auf sie verweisen und je höher die Qualität der verweisenden Seite ist. Der PageRank bestimmt auch wesentlich die Reihenfolge, in der Google dem Anfrager die Ergebnisse präsentiert.
Spektrum: Ist der PageRank manipulierbar, etwa durch ein Zitierkartell?
Henzinger: Es wird zumindest immer wieder versucht. Zum Beispiel ist "Britney Spears" ein sehr häufiger Suchbegriff. Deswegen versuchen viele, ihren PageRank hochzutreiben, um unter den Antworten auf "Britney Spears" auf den vordersten Plätzen zu landen, auch wenn sie bloß Turnschuhe verkaufen.
Spektrum: Und was tun Sie dagegen?
Henzinger: Wenn wir offensichtlichen Missbrauch sehen, nehmen wir die entsprechenden Seiten gezielt heraus – im Interesse unserer Benutzer, für die wir die Qualität wahren wollen.
Spektrum: Gibt es auch andere Maßnahmen als diese Einzelkorrekturen?
Henzinger: Ja. Aber die diskutieren wir nicht öffentlich, um den "Rüstungswettlauf" nicht anzuheizen.
Spektrum: Seit wann gibt es Google?
Henzinger: Die Firma existiert seit dreieinhalb Jahren. Seit reichlich zwei Jahren sind wir auf dem Markt. Die Kunde von uns hat sich durch Mundpropaganda verbreitet, und inzwischen kommt die Hälfte der Anfragen von außerhalb der USA, zwölf Prozent allein aus dem deutschsprachigen Raum.
Wir beantworten über 150 Millionen Anfragen am Tag, und zwar direkt oder über unsere Partner. Wenn zum Beispiel die Suchmaschine Yahoo ein Stichwort nicht im eigenen Verzeichnis findet, reicht sie die Anfrage an uns weiter und gibt dem Benutzer unsere Antwort.
Spektrum: Mit welcher Hardware läuft das System?
Henzinger: Mit über zehntausend PCs, verteilt auf vier Datenzentren. Betriebssystem ist Linux.
Spektrum: Wie prüfen Sie, ob die aufgeführten Webseiten noch existieren?
Henzinger: Besonders ereignisreiche Webseiten besuchen wir täglich. Alle 28 Tage aktualisieren wir den Index – das ist die Liste, die zu jedem Wort die Seiten aufführt, auf denen es vorkommt.
Spektrum: Wie aufwendig ist dieses Indizieren?
Henzinger: Sehr aufwendig. Etwa eine Woche.
Spektrum: Wie viele Leute hat die Firma?
Henzinger: Ungefähr 300. Bisher haben wir unsere Belegschaft in jedem Jahr ungefähr verdoppelt.
Spektrum: Wie finanziert sich Google?
Henzinger: Überwiegend durch gewöhnliche Reklame: einzeilige Anzeigen, die nur aus durchlaufendem Text bestehen. Diese Werbung erscheint nur auf solche Fragewörter, die mit dem Produkt in Verbindung stehen; wir nennen das "keyword targeting". Auch kann jeder online eine Anzeige kaufen. Wenn Sie Ihrer Frau über Google zum Geburtstag gratulieren wollen, können Sie eine Anzeige schalten, die nur auf deren Namen hin erscheint.
Zweitens durch Search Services. Zum Beispiel bezahlt uns Yahoo dafür, dass unsere Ergebnisse auf deren Seite erscheinen. Manche Firmen wollen auf ihrer Webseite eine Suchfunktion einrichten, aber nicht selbst programmieren. Für diese Unternehmen bauen wir dann einen eigenen Index und beantworten damit die Suchanfragen, die an sie gestellt werden. Schließlich verkaufen wir neuerdings unsere Produkte zur firmeninternen Nutzung in Intranets.
Mit diesem Konzept sind wir eine der wenigen neuen Internet-Firmen, die ihr Geld verdienen.
Spektrum: Gibt es neue Projekte?
Henzinger: Zum Beispiel Spracheingabe. Der Benutzer spricht seine Frage in ein Mikrofon und bekommt die Antworten auf den Bildschirm, später vielleicht auch gesprochen.
Oder unser News Search. Unsere Maschinen lesen Tageszeitungen und stellen Artikel zum gleichen Thema aus verschiedenen Ländern zusammen. Das ist interessant, weil die Berichterstattung zumeist national gefärbt ist. Ein regelmäßiger Vergleich kann den Horizont erweitern. Klicken Sie unter google.com auf "News and Resources" und dann "Check out the Google news search".
Oder User Interfaces. Wie bringt man den Benutzer dazu, mehr als zwei Wörter einzutippen? Je mehr Wörter er ansagt, desto besser können wir ihn bedienen.
Ohne Suchmaschinen wären in der chaotischen Vielfalt des World Wide Web die relevanten Informationen kaum zu finden. Solche speziellen Programme liefern auf ein Stichwort hin eine Liste von Webseiten, die dazu etwas Bedeutendes zu sagen haben (so die Idealvorstellung) oder in denen das Stichwort irgendwo vorkommt (so die Realität). Binnen kurzem wurde auch in Europa Google (www.google.com oder www.google.de) bekannt und zur meistgefragten Suchmaschine überhaupt. Der Name spielt auf den amerikanischen Spitznamen "googol" für 10100 an.
Aus: Spektrum der Wissenschaft 7 / 2002, Seite 106
© Spektrum der Wissenschaft Verlagsgesellschaft mbH
Schreiben Sie uns!
Beitrag schreiben