Die Maschine empfiehlt
Wer kennt unsere Filmvorlieben am besten, weiß, welche Serien wir noch nicht gesehen haben und hat den Überblick über das Shoppingangebot? In vielen Fällen ist das kein Mensch, sondern Netflix oder Amazon. Hinter den Empfehlungen stecken passgenaue Algorithmen und teure Software. Um auch kleineren Firmen einen guten Empfehlungsdienst zu ermöglichen, entwickelt Professor Dr. Jöran Beel von der Universität Siegen eine Software, die selbst lernt, die besten Empfehlungen zu geben.
Von Streamingdiensten sind wir es gewohnt, auf neue Serien hingewiesen zu werden, die uns gefallen könnten. News-Seiten empfehlen uns Artikel, die vielleicht unser Interesse wecken. Facebook schlägt uns Kontakte vor, die wir kennen könnten. Fast auf jeder größeren Webseite ist ein Empfehlungsdienst installiert – mal funktioniert er besser, mal schlechter. Für die Unternehmen bedeutet die Funktionalität oft bares Geld: Werden Kundinnen und Kunden gehalten oder springen sie ab? »Derzeit gibt es zwei Möglichkeiten für Firmen, einen Empfehlungsdienst zu nutzen«, sagt Prof. Dr. Jöran Beel, Professor für intelligente Systeme an der Universität Siegen. »Entweder Sie stellen viele ExpertInnen ein, die einen individuellen Empfehlungsdienst für die jeweilige Firma entwickeln, oder Sie bezahlen ein Unternehmen, das den Dienst anbietet.« Die großen Player wie Netflix können sich die erste Variante leisten, die meisten anderen Unternehmen bezahlen ein Abonnement für einen Empfehlungsdienst. Viel Geld für häufig relativ schlechte Qualität, sagt der Informatiker.
Beel möchte das ändern. Er arbeitet daran, einen qualitativ hochwertigen Empfehlungsdienst zu entwickeln, der auf die Bedarfe von kleinen und mittleren Unternehmen ausgelegt ist. Der Weg dahin ist ein langer. Er und KollegInnen testeten auf sechs News-Seiten – wie zum Beispiel tagesspiegel.de oder motor-talk.de – fünf verschiedene Algorithmen für Empfehlungen: Zwei Algorithmen suchten die populären Artikel heraus; zwei weitere identifizierten NutzerInnen mit ähnlichen Vorlieben und empfahlen dann die Artikel, die der eine Nutzer mochte, einer anderen Nutzerin; und ein fünfter Algorithmus schlug Artikel mit ähnlichem Inhalt vor wie der bereits gelesene Artikel. Besuchte jemand eine der News-Seiten, wählten die ForscherInnen zufällig einen der fünf Algorithmen aus und erzeugten damit eine entsprechende Empfehlung.
Danach maßen sie die Klickrate: Je öfter ein empfohlener Artikel gelesen wurde, desto besser funktionierte der Algorithmus. »Da alle sechs Seiten Nachrichten veröffentlichen, sind wir davon ausgegangen, dass ein Algorithmus, der auf einer Seite gut funktioniert, auch auf den anderen Seiten nicht schlecht sein sollte«, sagt Beel. »Es hat sich aber gezeigt, dass die Algorithmen auf jeder Seite unterschiedlich gut abschnitten.« Neben der Branche seien weitere Faktoren relevant, wie zum Beispiel das Geschlecht und Alter der LeserInnen oder die Tageszeit, zu der die Artikel gelesen werden.
Neuer Empfehlungsdienst lernt und verbessert sich selbst
In Beels Projekt an der Universität Siegen sollen nicht Menschen den passenden Algorithmus auswählen, sondern die Software selbst. Der Datenwissenschaftler stellt sich eine Software vor, die in vielen Unternehmen unterschiedlicher Gewerbe angewendet und einfach in die Webseite integriert werden kann. »Wir wollen unseren Empfehlungsdienst so weit wie möglich automatisieren, sodass er so einfach wie Microsoft Word oder Gmail zu bedienen ist«, sagt Beel. Dafür kombiniert der Wissenschaftler den klassischen Empfehlungsdienst mit dem automatisierten maschinellen Lernen (AutoML).
Zunächst arbeitet Beel mit seinen zwei Doktoranden aus Irland und Frankreich an komplexen Tests: »Wir erfassen einige Dutzend Grund-Algorithmen, die verschiedene Ansätze verfolgen. Bei jedem Algorithmus gibt es weitere tausend Variationen, die wir durchgehen und anpassen.« Auf diese Weise soll die Basis für die Empfehlungssoftware entstehen. Erst der zweite Schritt macht aus der Software einen selbstlernenden Empfehlungsdienst: Unternehmen aus den Onlinehandel- und Nachrichtengewerben sollen die Software testweise für ihre Zwecke anwenden, damit die ForscherInnen die Ergebnisse für das maschinelle Lernen nutzen können. »So sparen wir zum einen Entwicklungszeit, zum anderen wird unsere Software deutlich besser funktionieren als die vorhandenen Abonnements«, sagt Beel.
Für das Projekt hat der Informatiker 1,25 Millionen Euro verteilt über fünf Jahre zur Verfügung. Die Förderung stammt aus dem NRW-Rückkehrprogramm, das Beel im Oktober 2020 an die Universität Siegen gebracht hat. Er bewarb sich vom Trinity College Dublin (Irland) auf das Programm. In Beels Lebenslauf finden sich Forschungsaufenthalte am National Institute of Informatics in Tokio (Japan), an der Universität Zypern und an der Universität von Kalifornien in Berkeley (USA). Sein weiteres Leben möchte der 40-Jährige nun wieder in seiner Heimat in Deutschland verbringen und in einem Wissenschaftssystem arbeiten, das er als attraktiver und mit mehr Freiheiten ausgestattet verbindet als in den meisten anderen Ländern. Universität und Stadt Siegen haben den Informatiker mit ihrem fachlichen und unternehmerischen Umfeld gelockt.
Empfehlungen auch außerhalb der Informationsblase geben
Die Anwendungsnähe ist dem Informatiker wichtig: Zwei Start-ups und ein Forum zu Empfehlungsdiensten hat er selbst gegründet und in fünf Jahren soll sein selbstlernender Empfehlungsdienst weltweit erfolgreich genutzt werden. Beel ist zuversichtlich, dass die Software schnell und gut funktionieren wird. Mit einer perfekten Lösung rechnet er allerdings erst zu seinem Renteneintritt, denn Herausforderungen gibt es noch genug: »Ein guter Empfehlungsdienst zeigt uns die Artikel, die uns ansprechen, die aber auch nicht zu sehr dem entsprechen, was wir normalerweise lesen. So sehen wir auch etwas außerhalb unserer Filter Bubble.« Denn Empfehlungsdienste können uns in eine Filter Bubble (Filterblase) bringen, wenn sie uns nur die Artikel empfehlen, die in unser Weltbild passen. Der selbstlernende Empfehlungsdienst von Beel soll dieses Problem berücksichtigen und uns auch Artikel zeigen, die anders sind, allerdings nicht zu weit weg von unseren Vorlieben.
Auch den Datenschutz müssen Beel und sein Team mitdenken. Irgendwann soll der Empfehlungsdienst ebenfalls in der Medizin eingesetzt werden, gerade hier sind die Daten besonders sensibel. Der Siegener Informatiker sieht in Maschinen, die intelligent mit Daten umgehen, ein großes Potenzial: »Ich stelle mir eine Welt vor, in der Hausärzte und -ärztinnen von einer Software Unterstützung für ihre medizinischen Diagnosen erhalten, in der Teenager ihre Taschengeldausgaben visualisieren und in der Forschende die passende Literatur für ihr Projekt vorgeschlagen bekommen.«
Kontakt
Prof. Dr. Jöran Beel, Universität Siegen
E-Mail: joeran.beel@uni-siegen.de
Text: Linda Thomßen
Fotos: Sascha Hüttenhain Photography
Wissenschaftlicher Ansprechpartner:
Prof. Dr. Jöran Beel, Universität Siegen
E-Mail: joeran.beel@uni-siegen.de