Die fabelhafte Welt der Mathematik: Wie Netflix und Co. uns (nicht) den passenden Film vorschlagen
Ob Spotify, Amazon, Netflix oder Instagram: Täglich begegnen wir Algorithmen, die uns Inhalte oder Produkte empfehlen. Und das scheint gut zu funktionieren. So gab der Streamingdienst Netflix bereits 2017 an, dass die Nutzerinnen und Nutzer etwa 80 Prozent der Shows durch Empfehlungen entdecken. Wenn ich mir allerdings anschaue, was die US-amerikanische Streamingplattform mir so anbietet, bin ich oft nur mäßig begeistert. Zum Beispiel wird mir die Serie »Tour de France: Im Hauptfeld« mit einer Übereinstimmung von 98 Prozent nahegelegt, obwohl ich mich weder für Doku-Serien zum Thema Sport noch für Radrennen im Speziellen interessiere. Auch bei Spotify, Amazon oder Twitter (inzwischen X) bin ich immer wieder verdutzt, welche Inhalte mir die Algorithmen zeigen. Dass die Plattformen öfter mal danebenliegen, ist nicht allzu verwunderlich, wenn man sich die komplizierten Mechanismen ansieht, anhand derer sie ihre Empfehlungen geben.
Und doch erlebe ich oft das Gegenteil: Kaum denke ich, dass ich bald eine neue Regenjacke brauche, wird mir schon Werbung dazu geschaltet. Sofern ich es zulasse, können die Online-Unternehmen verschiedenste Daten sammeln, etwa über mein Surfverhalten oder über meinen Standort, die sie auswerten und mir entsprechende Produkte anbieten. Die dafür benötigten Systeme werden ständig verbessert und können immer präzisere Empfehlungen machen. Aber wie funktioniert das im Detail?
Es gibt verschiedene Zusammenhänge, die man bei einer Empfehlung berücksichtigen kann, etwa die Verbindung zwischen den Personen und Produkten. Da ich zum Beispiel gerne jogge, passen Produkte wie Laufschuhe und Sportkleidung zu mir – diese Information ist für einen Anbieter wie Amazon besonders interessant. Aber auch die Beziehungen von Produkten untereinander spielen eine Rolle: So hängt eine Handyhülle mit einem Handy zusammen, ebenso wie Filme des gleichen Genres oder Bücher desselben Autors. Und schließlich kann es auch Zusammenhänge zwischen Nutzerinnen und Nutzern geben. Wenn mir ebenso wie einem anderen User die Serie »Sherlock Holmes« gefallen hat, dann könnten mir genauso weitere Inhalte gefallen, die der User positiv bewertet hat.
Damit ein Empfehlungsalgorithmus diese wechselseitigen Beziehungen untersuchen kann, braucht er jede Menge Daten. Deshalb fordern viele Anbieter wie Netflix, Amazon und Spotify ihre Nutzerinnen und Nutzer auf, ihre Inhalte zu bewerten. Da das aber nicht immer zuverlässig getan wird, greifen einige der Algorithmen auch auf andere Informationen zu: zum Beispiel spezifische Beschreibungen der Produkte sowie Kundendaten (welches Alter, welches Geschlecht, welcher Wohnort?).
Hat eine Firma genügend Daten gesammelt, gibt es im Wesentlichen zwei Ansätze, um Empfehlungen auszusprechen. Der erste nennt sich »kollaboratives Filtern«. Dabei stützt man sich auf Bewertungen, die andere Nutzerinnen und Nutzer mit ähnlichem Verhalten gemacht haben. Einen speziellen Ansatz dieser Form hat sich Amazon bereits 1998 patentieren lassen, ist aber inzwischen weit verbreitet. Die zweite Methode sind inhaltsbasierte Empfehlungen, bei denen Nutzern ähnliche Produkte empfohlen werden, wie jene, die sie bereits positiv bewertet haben. Beide Ansätze haben ihre Vor- und Nachteile und werden häufig miteinander kombiniert, um ein besseres Ergebnis zu erhalten.
Kollaboratives Filtern
Angenommen, Sie möchten eine Art Mini-Netflix-Plattform aufbauen, mit sechs verschiedenen Filmen und fünf Nutzern. Diese haben sich bereits ein paar der Inhalte angesehen und bewertet, mit Punkten von eins bis fünf (je höher die Punktzahl, desto besser hat Ihnen der Film gefallen). Anhand dieser Daten können Sie über ein kollaboratives Filtersystem entscheiden, welche Filme sie den Usern empfehlen könnten. Die Bewertungen schreiben Sie in einer Tabelle nieder, wobei die Spalten den Filmen und die Reihen den Nutzern entsprechen. In der Mathematik nennt sich so eine listenartige Struktur, deren Einträge Zahlenwerte sind, Matrix. Das ist äußerst praktisch, denn mit Matrizen kann man ebenso wie mit gewöhnlichen Zahlen rechnen.
Oppenheimer | Barbie | Dune | Interstellar | Indiana Jones und das Rad des Schicksals | Blade Runner | |
U1 | 4 | 5 | 1 | |||
U2 | 5 | 5 | 4 | |||
U3 | 2 | 4 | 5 | |||
U4 | 1 | 2 | ||||
U5 | 3 | 3 |
Da nicht jede Person alle Filme gesehen hat, sind viele Felder der Matrix leer. Hier zeigt sich die größte Schwierigkeit von Empfehlungsalgorithmen: Man muss anhand einer sehr dünnen Datenlage versuchen, möglichst treffende Schlüsse zu ziehen. Um dem Nutzer U1 zum Beispiel eine Empfehlung auszusprechen, können Sie versuchen herauszufinden, welcher andere User einen ähnlichen Filmgeschmack hat.
Aber wie stellt man fest, welche Nutzerinnen und Nutzer sich am ähnlichsten sind? Man muss dafür eine Art Distanz definieren, die angibt, wie weit die Geschmäcker zweier Personen voneinander abweichen. Dafür kann man auf die mathematische Disziplin der Maßtheorie zurückgreifen.
Selbst in unserem alltäglichen Leben gibt es mehrere Möglichkeiten, Entfernungen anzugeben. Möchte man zum Beispiel die Entfernung zwischen zwei nicht allzu weit voneinander entfernten deutschen Städten berechnen, etwa Heidelberg und Stuttgart, nutzt man im Allgemeinen die euklidische Metrik: Man zieht auf einer Karte eine gerade Linie zwischen beiden Orten und misst deren Länge. Möchte man hingegen herausfinden, wie weit Heidelberg von New York entfernt ist, wird das Ganze etwas komplizierter. Statt eine Gerade auf einer Landkarte einzuzeichnen, muss man einen Faden um einen Globus legen. Wie man feststellen wird, ist der kürzeste Weg zwischen beiden Städten keine Gerade, sondern eine Kurve – die Erde ist nun mal nicht flach. Und wenn man sich innerhalb einer Stadt wie New York oder Mannheim von einem Ort zu einem anderen bewegen möchte, nutzt es nichts, die Distanz in Luftlinie zu kennen. Wegen der schachbrettförmigen Anordnung der Straßen kann man sich bloß entlang rechter Winkel bewegen, so dass man die tatsächliche Laufdistanz mit der Manhattan-Metrik angeben muss.
Tatsächlich lassen sich allerlei Metriken und Ähnlichkeitsmaße definieren, die verschiedensten Zwecken dienen: So lässt sich die Ähnlichkeit von Genen oder Wörtern ebenso bestimmen wie die Ähnlichkeit von Interessen verschiedener Nutzerinnen und Nutzer. Für das Beispiel des Mini-Netflix-Systems könnten Sie jedem Nutzer eine Liste von Zahlen mit den entsprechenden Bewertungen (einen so genannten Vektor) zuordnen. Damit haben Sie gewissermaßen fünf Geraden, je eine pro Nutzer, die sich in einem sechsdimensionalen (je eine Dimension pro Film) Raum befinden. Eine Möglichkeit, die Ähnlichkeit zweier Vektoren zu ermitteln, besteht darin, den Winkel, den sie miteinander einschließen, zu bestimmen. Diese Größe wird als Kosinus-Ähnlichkeit bezeichnet.
Im obigen Beispiel kann man zum Beispiel die Nutzer U1 und U2 sowie U1 und U3 miteinander vergleichen, da sie teilweise gleiche Filme bewertet haben. U1 und U2 haben beide »Oppenheimer« gut bewertet, einmal mit vier, einmal mit fünf Punkten. U1 und U3 haben hingegen sowohl »Interstellar« als auch »Indiana Jones« bewertet, kamen aber zu unterschiedlichen Ergebnissen. Um jeweils den Winkel zwischen den zwei Vektoren zu berechnen, muss man sie über das Skalarprodukt miteinander multiplizieren und anschließend durch die beiden Vektorlängen teilen. Führt man das für das obige Beispiel durch, zeigt sich, dass der Winkel zwischen U1 und U2 kleiner ist als jener zwischen U1 und U3. Damit scheinen U1 und U2 einen ähnlicheren Filmgeschmack zu haben als U1 und U3. Da U2 »Barbie« gefallen hat und U1 diesen Film noch nicht gesehen hat, kann man ihm dem Nutzer vorschlagen.
Natürlich gibt es in realistischen Anwendungen wie bei Netflix deutlich mehr Nutzerinnen und Nutzer, die einen ähnlichen Geschmack haben. Daher stützen sich die Empfehlungen nicht bloß auf die Ähnlichkeit zu einem einzigen User, sondern die Systeme beziehen auch die Bewertungen anderer Personen mit ein – gewichtet danach, wie ähnlich diese den Bewertungen des betreffenden Nutzers sind. Auf diese Weise lässt sich besser beurteilen, welcher Film einer Person gefallen könnte – und welcher nicht.
Wie geht man mit spärlichen Daten um?
Hier offenbart sich der schwerwiegendste Nachteil von kollaborativen Filtersystemen: Falls man nicht genügend Daten hat – etwa wenn ein Nutzer sich neu anmeldet – kann man nur schwerlich eine Empfehlung aussprechen. Daher bitten Anbieter wie Netflix bei einer Anmeldung oft darum, bereits gesehene Inhalte zu bewerten. Aber auch das hat seine Tücken: Nur weil mir zum Beispiel der Film »Oppenheimer« gefallen hat, heißt das nicht, dass ich generell historische Filme mag, wie es etwa bei einem anderen Nutzer der Fall sein kann, der »Oppenheimer« ebenfalls positiv bewertet hat. Neben den Bewertungen verwenden manche Plattformen noch andere Daten, um ähnliche Interessen herauszufiltern wie Alter, Geschlecht, Wohnort oder das Nutzerverhalten. Zum Beispiel tracken manche Anbieter, wie lange sich Nutzerinnen und Nutzer gewisse Inhalte ansehen oder welche anderen Websites sie besuchen.
Aus all diesen Informationen ergibt sich eine riesige Matrix mit etlichen Zeilen und Spalten, deren Größe sich ständig verändert. Mit jedem neuen Nutzer oder neuem Produkt wächst die Matrix an. Für ein optimales Ergebnis muss man sie ständig neu auswerten. Das bringt selbst die Rechenkapazitäten großer Anbieter wie Netflix und Amazon an ihre Grenzen. Mit der reinen Kosinus-Ähnlichkeit kommt man also nicht unbedingt weiter.
Um mit den irrsinnigen Datenmengen umzugehen und darin Muster zu erkennen, verwenden Unternehmen gängige Methoden aus der linearen Algebra, wie die Singulärwertzerlegung oder eine Hauptkomponentenanalyse. Die Idee dahinter ist, die Matrix durch ein Produkt aus einfacheren Matrizen auszudrücken – ähnlich wie die Primfaktorzerlegung einer Zahl. Die einfacheren Matrizen enthalten ebenfalls Informationen über die Präferenzen der Nutzerinnen und Nutzer, die leichter zugänglich sind. Mit diesem Ansatz kann man nicht allzu wichtige Informationen, die kleinen Zahlenwerten in den Matrizen entsprechen, durch null nähern. Indem man die genäherten, einfachen Matrizen wieder miteinander multipliziert, erhält man eine neue Matrix, die der ursprünglichen ähnelt, aber eine deutlich simplere Form hat. Ein Computer kann sie besser verarbeiten, um Empfehlungen für die Nutzerinnen und Nutzern auszugeben.
In den vergangenen Jahren wurden zunehmend KI-Modelle genutzt, um die Daten zu verarbeiten. Die selbstlernenden Algorithmen werden darauf trainiert, Muster in den Daten zu erkennen. Auf diese Weise können auch sie vorhersagen, welche Inhalte einer Person gefallen könnten. Dabei sei es besonders wichtig, Neuerscheinungen zu berücksichtigen, wie der Streamingdienst von Amazon Prime Video betont. Häufig koppeln Unternehmen die KI-Systeme zusätzlich mit einer Technik namens Reinforcement Learning: Dabei entwickeln sich die Modelle durch das Feedback der Nutzerinnen und Nutzer ständig weiter. Falls Ihnen zum Beispiel der neue »Barbie«-Film vorgeschlagen wird, sie diesen aber schlecht bewerten, dann lernt das System daraus, um Ihnen in Zukunft bessere Vorschläge zu machen.
Mit dem kollaborativen Ansatz kann man aber nicht nur Nutzerinnen und Nutzer miteinander verknüpfen, sondern auch Produkte. Ein solches Empfehlungssystem stellte Amazon 2003 vor. Würde man nach diesem Prinzip wieder eine Mini-Netflix-Plattform aufbauen wollen, würde man die Tabelle umkehren: Die Reihen entsprechen dann den Filmen und die Spalten den Nutzern. Um eine fehlende Bewertung zu ergänzen, etwa (wie gefällt U1 der Film »Barbie«?) sucht man nicht nach einem anderen Nutzer mit ähnlichem Geschmack. Stattdessen ermittelt man ähnliche Filme wie »Barbie«, die U1 bereits bewertet hat. Da zum Beispiel »Oppenheimer« und »Dune« ähnlich bewertet wurden wie »Barbie«, ließe sich daraus schließen, dass sich diese Inhalte ähneln. Um das systematisch anzugehen, kann man wie zuvor ein Ähnlichkeitsmaß nutzen, um auf diese Weise eine Empfehlung auszusprechen.
Für Amazon hat sich dieser Ansatz besser bewährt, da sich die Kaufhistorie eines Nutzers innerhalb eines Tages drastisch ändern kann. Damit die Methode funktioniert, ist es entscheidend, wie man die Ähnlichkeit von Produkten definiert. Amazon wertet dafür aus, ob ein Käufer von Produkt A überdurchschnittlich oft ein Produkt B kauft. So sind Laufschuhe oft mit Sportkleidung und Trinkflaschen verbunden. In den folgenden Jahren hat Amazon seinen Empfehlungsalgorithmus kontinuierlich angepasst.
Inhaltsbasierte Empfehlungen
Der kollaborative Ansatz funktioniert nur gut, wenn man viele Daten zu allen Nutzerinnen und Nutzern hat. Inhaltsbasierte Empfehlungen fokussieren sich hingegen auf die Produkte, die man empfehlen möchte. Zum Beispiel kann man Filme nach Genre, Regisseuren, Schauspielern, Länge und so weiter kategorisieren. Das geschieht inzwischen teilweise automatisiert. Indem man die Präferenzen eines Nutzers für die entsprechenden Kategorien mit den Inhalten abgleicht, kann man auf dieser Grundlage ebenfalls Empfehlungen aussprechen. Wenn zum Beispiel aus dem Streamingverhalten einer Person deutlich wird, dass sie den Sciencefiction-Film »Interstellar« von Christopher Nolan und »Barbie« mit dem Schauspieler Ryan Gosling gesehen hat, wird ihr ein inhaltsbasiertes System Inhalte mit ähnlichen Attributen empfehlen: etwa andere Filme des Regisseurs Christopher Nolan wie »Oppenheimer« oder Sciencefiction-Filme mit Ryan Gosling wie »Blade Runner«. Auch hierfür kann man die Kosinus-Ähnlichkeit nutzen, um bereits gesehene Inhalte mit anderen Produkten abzugleichen.
»Milliarden von Parametern wirken auf subtile Weise zusammen, um eine Vorhersage zu treffen. Sie zu betrachten ist so, als wollte man die Psychologie verstehen, indem man einzelne Gehirnzellen untersucht«Thomas Dimson, IT-Entwickler
Der Vorteil dieser Methode besteht darin, dass man keine expliziten Bewertungen eines Users braucht. Es ist wichtiger, die Produkte richtig zu charakterisieren – eine Aufgabe, die Algorithmen übernehmen können. So lassen sich beispielsweise Filme auf häufig vorkommende Worte untersuchen und dadurch kategorisieren. Dafür sind Sprachmodelle nötig, die in den letzten Jahren große Fortschritte gemacht haben.
Die meisten Empfehlungsalgorithmen verwenden inzwischen hybride Ansätze, die sich aus kollaborativen und inhaltsbasierten Systemen zusammensetzen. Ein Beispiel dafür ist Netflix: Es trifft Empfehlungen auf Grund des Nutzerverhaltens und der Ähnlichkeit zu anderen Nutzerinnen und Nutzern, berücksichtigt aber auch die Präferenzen bezüglich des Genres, der Schauspieler, des Erscheinungsjahrs und anderer Attribute. Zudem wertet die Plattform aus, zu welcher Uhrzeit man sie bevorzugt nutzt, wie lange und auf welchem Endgerät. Aber »das Empfehlungssystem bezieht keine demografischen Informationen (wie Alter oder Geschlecht) in den Entscheidungsprozess ein«, gibt Netflix an.
Wie transparent sollte ein Empfehlungsalgorithmus sein?
Empfehlungsalgorithmen sind das Herzstück vieler Internetanbieter. So ist das chinesische Videoportal TikTok vor allem deshalb so beliebt, weil es sehr gut darin ist, den Nutzerinnen und Nutzern interessante Inhalte vorzuschlagen. Es scheint also nicht erstaunlich, dass viele Unternehmen ihre Algorithmen unter Verschluss halten. Im März 2023 machte Twitter, das inzwischen X heißt, seinen Empfehlungsalgorithmus auf GitHub publik, inklusive einer Erklärung, wie das System funktioniert. Damit ein Inhalt in der Timeline einer Person erscheint, werden zunächst die besten Tweets aus verschiedenen »Empfehlungsquellen« gesammelt, die ein KI-Modell anschließend bewertet. Dann werden Tweets von geblockten Personen oder solche, die bereits gesehen wurden, herausgefiltert.
Den Quellcode eines Empfehlungsalgorithmus zu veröffentlichen, trage allerdings nicht wirklich zur Transparenz der Prozesse bei, argumentiert der IT-Entwickler Thomas Dimson, der Instagrams ursprünglichen Bewertungsalgorithmus entworfen hat, auf Future.com. »Es gibt Milliarden von Parametern, die auf subtile Weise zusammenwirken, um eine endgültige Vorhersage zu treffen. Sie zu betrachten ist so, als ob man die Psychologie verstehen wollte, indem man einzelne Gehirnzellen untersucht«, schreibt Dimson.
»Nicht ein einziges Mal hat mir Meta eine Liste mit zehn Produkten vorgelegt und mich gefragt, welche davon ich mag. Das Unternehmen schaut mir lieber über die Schulter, wenn ich im Internet nach einem neuen Regenmantel suche«Devin Coldewey, Journalist
Völlig einsehbar sollten die Empfehlungsalgorithmen jedoch nicht sein, denn das kann zu Datenschutzproblemen führen. So lobte Netflix 2006 einen Wettbewerb aus, bei dem Entwicklerinnen und Entwickler möglichst gute Empfehlungsalgorithmen einreichen konnten. Zu gewinnen gab es eine Million US-Dollar. Dafür stellte der Streamingdienst Trainingsdaten mit 100 480 507 Bewertungen zur Verfügung, die 480 189 Nutzerinnen und Nutzer zu 17 770 Inhalten abgegeben hatten. Obwohl die Daten anonymisiert waren, gelang es 2008 zwei Forschern der University of Texas in Austin, einige User anhand ihrer Bewertungen auf der Filmdatenbank IMDb zu identifizieren.
Deshalb schlägt Meta, der Konzern hinter Facebook und Instagram, einen anderen Weg ein, um transparent zu sein. So kann man sich inzwischen auf den Plattformen erklären lassen, warum gewisse Inhalte angezeigt werden. Zugleich gab Meta im Juni 2023 bekannt, künftig riesige KI-Modelle, »größer als die bisher größten Sprachmodelle wie GPT-4 und ChatGPT«, für ihre Empfehlungen zu nutzen. Schon jetzt macht sich der vermehrte Einsatz von KI-Modellen bemerkbar, so habe die Nutzungsdauer auf Instagram im ersten Quartal 2023 um 24 Prozent zugenommen.
Angesichts all der Fortschritte im Bereich der künstlichen Intelligenz und insbesondere der Sprachmodelle wird die Präzision der Empfehlungsalgorithmen in Zukunft höchstwahrscheinlich zunehmen. Mit wachsender Größe der Modelle nimmt aber auch die Transparenz der Algorithmen ab – und es bleibt unklar, welche nutzerbezogene Daten ein Algorithmus verwendet. Doch nicht jeder zeigt sich von den aktuellen Fortschritten beeindruckt. »Nicht ein einziges Mal hat mir Meta eine Liste mit zehn Produkten vorgelegt und mich gefragt, welche davon ich mag. Das Unternehmen schaut mir lieber über die Schulter, wenn ich im Internet nach einem neuen Regenmantel suche, und tut so, als wäre es eine Meisterleistung fortschrittlicher künstlicher Intelligenz, wenn es mir am nächsten Tag Anzeigen für Regenmäntel präsentiert«, schreibt der Journalist Devin Coldewey auf »TechCrunch«.
Empfehlungsalgorithmen sind auch eine Erklärung dafür, warum viele das Gefühl haben, ihr Smartphone würde zuhören. Wenn man mit jemandem über eine Regenjacke spricht und kurz darauf Werbung für einen solchen Artikel auf Instagram oder Facebook geschaltet wird, dann liegt das nicht daran, dass das Handy die Unterhaltung aufgezeichnet hat. Aber Meta, der Mutterkonzern von Instagram und Facebook, analysiert seiner Nutzerinnen und Nutzer sehr genau: Neben den Kontakten der User, werden auch Standortdaten und das Surfverhalten untersucht – die ausgefeilten Empfehlungsalgorithmen können daraus schon viele Bedürfnisse ableiten. Völlig ohne illegales Abhören.
Schreiben Sie uns!
Beitrag schreiben