Berichte aus dem Maschinenraum
Big Data, Machine Learning, KI – in der Digitalisierungsdebatte geht es begrifflich zuweilen munter durcheinander. Nicht alles, was als KI bezeichnet wird, ist auch KI, und nicht alles, was smart ist, ist wirklich intelligent. Der Datenwissenschaftler Holger Aust versucht in seinem Buch »Das Zeitalter der Daten« Ordnung in dieses Wirrwarr zu bringen. In sieben Kapiteln erklärt er, wie Maschinen lernen, wie neuronale Netze funktionieren und was die typischen Aufgaben eines Datenwissenschaftlers sind.
Kundenbindung dank KI
Zum Beispiel berechnet ein solcher die Wahrscheinlichkeit, mit der ein Kunde ein Abo kündigt, etwa einen Strom- oder Handyvertrag. Idealerweise weiß das Unternehmen schon vorher, dass ein Kunde kündigen will, denn dann kann es durch entsprechende Angebote gegensteuern – je nachdem, wie wertvoll der Kunde ist. Hier kommen Datenwissenschaftler ins Spiel: »Als Erstes benötigen wir einen Algorithmus, der für jeden Kunden vorhersagt, wie wahrscheinlich die Abo-Kündigung ist«, erklärt Aust. »Zweitens müssen wir überlegen, wie wir gegensteuern können. Soll der Kundenservice Nachricht erhalten, damit er dem Kunden doch etwas anbietet, um zu bleiben? Oder erfolgt das Angebot sogar vollautomatisch per E-Mail?« Das Angebot müsse so an die Person angepasst werden, »dass die Wahrscheinlichkeit des Bleibens maximiert wird und gleichzeitig die Kosten möglichst gering bleiben«, erläutert der Autor.
Data Science, das wird bei der Lektüre schnell klar, ist keine Raketenwissenschaft, sondern viel Mathematik. Mit Regressionsanalysen lässt sich etwa herausfinden, welchen Einfluss Variablen wie Geschlecht, Vertragslaufzeit oder Monatsgebühr auf die Kündigung haben. Nicht nur bei Abo-Kündigungen können explorative Datenanalysen wichtige Erkenntnisse liefern, sondern auch in der Logistik oder im Online-Handel.
Jeder kennt die Empfehlungssysteme, die bestimmte Produkte anpreisen (»Kunden, die diesen Artikel angesehen haben, kauften auch«). Für den Händler gebe es dabei verschiedene Optimierungsmöglichkeiten, so Aust: Man könne Artikel anzeigen, die eine hohe Konversionsrate (der Anteil der Kaufabschlüsse gemessen an den Anzeigen) versprechen, aber auch solche, die nicht oft gekauft werden, doch dafür mehr Umsatz bringen.
Rund ein Drittel der Amazon-Käufe sind unmittelbar auf Empfehlungen des Algorithmus zurückzuführen. Je besser die Maschine funktioniert, desto mehr Umsatz kann der Online-Riese generieren. Verlässliche Prognosen bedeuten also bares Geld.
Auch Supermärkte müssen ihre Abverkaufsmengen prognostizieren, um die richtigen Mengen zu bestellen. Bei saisonalen Produkten wie Erdbeeren ist das schwieriger als bei nichtsaisonalen Gütern wie Nudeln, die ganzjährig gekauft werden. Die Datenwissenschaftler berücksichtigen dabei verschiedene Faktoren wie Wettervorhersage oder Feiertage. Die Werte aus dem Vorjahr heranzuziehen, helfe leider nicht viel weiter, weil sich die Saisonalität von Jahr zu Jahr unterscheide und damit die Modelle zu früh oder zu spät reagieren, so der Autor.
Das war das Problem im ersten Lockdown 2020: Statt wie sonst Handy-Hüllen oder Ladegeräte wollten die Verbraucher plötzlich Toilettenpapier und Desinfektionsmittel. Produkte, die sonst kaum nachgefragt wurden, waren plötzlich begehrt wie nie. Das irritierte die algorithmischen Preisbildungssysteme derart, dass sie plötzlich Mondpreise aufriefen. So kostete bei Amazon ein Päckchen Reis zeitweise über 60 Dollar. Auch die Staumelder und Verkehrsprognosen gerieten durcheinander, weil die Menschen die meiste Zeit zu Hause saßen und keine brauchbaren Standortdaten lieferten.
Modelle basieren auf der Annahme, dass die Welt von morgen auch die Welt von gestern sein wird. Doch für eine Pandemie gab es keine historischen Daten. Die Datenwissenschaftler mussten ihre Modelle nachjustieren, etwa indem sie Daten anders gewichteten. Auf diese Problematik geht der Autor an der Stelle leider nicht ein. Allgemeine Aussagen wie »In der Vergangenheit liegt die Zukunft« wirken darum im Licht der Aktualität etwas erratisch. Trotz dieser kleineren Mängel liest man das Buch mit Gewinn, denn mit seiner Expertise vermag der Autor den technischen Fortschritt einzuordnen: »Der Aufwand, eine Aufgabe zu 100 Prozent zu automatisieren, ist wesentlich größer, als sie nur zu 90 Prozent zu automatisieren, wobei etwas menschliches Zutun notwendig bleibt«, so sein Fazit.
Holger Aust hat ein instruktives Werk vorgelegt, das fundiertes Hintergrundwissen vermittelt und anhand vieler Beispiele Einblicke in das Berufsbild des Datenwissenschaftlers gibt. Wer in der Digitaldebatte mitreden will, sollte dieses Buch lesen.
Schreiben Sie uns!
Beitrag schreiben