Sprachmodelle für die Wirtschaft: Wie deutsche Unternehmen profitieren
Mit ChatGPT, Bart und Llama ist eine neue KI-Generation in der Öffentlichkeit bekannt geworden. Die großen Sprachmodelle versprechen mächtige Werkzeuge für Wirtschaft und Gesellschaft. Doch vor der Einführung der Sprachassistenten in den Betrieben sind noch einige Hürden zu nehmen. Wie die deutsche Wirtschaft von Sprachmodellen profitiert und was dabei ein deutschsprachiges Open Source-Modell leisten kann, erläutert Alexander Löser im Interview. Er ist Professor für Data Science und Textbasierte Informationssysteme an der Berliner Hochschule für Technik und Mitglied der Arbeitsgruppe Technologische Wegbereiter und Data Science der Plattform Lernende Systeme.
Herr Löser, welche Einsatzmöglichkeiten eröffnen große Sprachmodelle für Unternehmen?
Da gibt es zunächst das Marketing und vielleicht auch die PR-Arbeit. Dann haben wir Anwendungsgebiete im Bereich der persönlichen Kundenansprache. Dabei muss das Unternehmen allerdings überlegen, ob es Kundendaten an einen Sprachmodell-Anbieter senden möchte, der nicht unter deutschem Recht agiert. Das halte ich für einen sehr wichtigen Punkt. Auch für den Kundenservice eignen sich die großen Sprachenmodelle von Open AI oder Anthropic nur bedingt, weil diese kein unternehmensspezifisches inhouse-Wissen haben. Für diesen Bereich werden wir vermutlich in Zukunft lokale Sprachmodelle zumindest anpassen und lokal vorrätig halten.
Ein weiteres Einsatzgebiet mit hohem Potenzial ist der ganze Bereich der Softwareentwicklung – Scripting, DevOps usw. Hierfür existieren bereits spezielle Sprachmodelle, die 80 Programmiersprachen unterstützen und Open-Source-basiert sind. Programmiererinnen und Programmierer können sie zur Unterstützung nutzen, um genaueren oder mehr Code in der gleichen Zeit zu schreiben.
Darüber hinaus gibt es spezielle Anwendungsgebiete, die mir persönlich sehr am Herzen liegen: die Vereinfachung von Prozessen der Medizin, das Erkennen von Krankheitssymptomen, vielleicht auch künftig Unterstützung bei medizinischen Diagnosen. Dazu muss allerdings zuerst das Problem des Halluzinierens großer Sprachmodelle gelöst und rechtliche Fragen geklärt werden.
Vor welchen Hürden stehen deutsche Unternehmen beim Einsatz von Sprachmodellen?
Zunächst stehen Unternehmen vor der Frage: Möchte man ein Vendor Lock-in mit einem Anbieter riskieren? Oft sogar einem Anbieter, der nicht nach europäischem Recht agiert. Die zweite Hürde ist, dass die aktuellen Modelle multilingual sind. Das ist einerseits gut, weil ein Modell dann möglicherweise Konzepte aus einer anderen Sprache ergänzen kann. Andererseits ist die Anzahl der Modelle, die wirklich Deutsch sprechen, derzeit noch auf äußerst wenige Anbieter beschränkt. Wir brauchen also ein deutschsprachiges Modell. Ich halte es für notwendig, dass deutsche Unternehmen auf ein Open-Source-gehostetes, kommerziell nutzbares Modell zugreifen können, damit sie dieses dann anpassen, für ihre eigenen Bedürfnisse explorieren und nutzen können.
Und die dritte Hürde sehe ich dann im Moderator-Layer. Wir haben auf der untersten Schicht das Sprachmodell, das nur das nächste Wort vorhersagt. Dann haben wir den Prompting Layer, der an die spezielle Domäne mit geringem Aufwand angepasst wird. Und dann haben wir die obere Ebene, das ist der Moderator-Layer. Und der Moderator Layer muss zum Beispiel im Kundenkontakt vermeiden, dass rassistische Sprache entsteht, dass gefährliche Informationen aus dem Modell herausdringen können und dass es entsprechend geltenden Gesetzen agiert – die schon in Deutschland deutlich anders sind als in anderen europäischen Ländern oder sogar in den USA. Und auch diese Trainingsdaten für den Moderator Layer sind bisher kaum vorhanden.
Was kann ein deutschsprachiges Open Source-Modell leisten?
Zunächst müssen Unternehmen in verschiedenen Industrien und in vielen verschiedenen Segmenten schnell in die Lage versetzt werden zu eruieren, ob sich mithilfe eines Sprachmodells Produktivitätsgewinne erzielen lassen, ob sein Einsatz eine höhere Kundenbindung ermöglicht oder möglicherweise dem Unternehmen sogar hilft, neue Märkte zu erobern.
Ich plädiere für ein Investment des Staates und auch von Unternehmen in ein kommerziell nutzbares Open Source-Modell. Ich glaube, dass dieses Investment deutlich geringer ausfällt als noch vor einem Jahr. Ich würde hier mit einer Summe zwischen 8 und 15 Millionen rechnen.
Der große Teil des Investments fließt in die Kuratierung und Beschaffung der Daten, ein kleinerer in die Berechnung. Es wäre erstrebenswert, wenn die Politik hier ein oder vielleicht sogar mehrere Projekte förderte mit dem Ziel, ein kommerziell nutzbares deutsches Open Source-Sprachemodell zu schaffen. Die Trainingsdaten müssten ebenfalls kommerziell nutzbar und Open Source zur Verfügung stehen. So könnte eine Innovations-Community aufgebaut werden, die dieses Sprachmodell an zahlreiche Gegebenheiten von Unternehmen anpasst und den Moderatoren-Layer entsprechend der deutschen Rechtsprechung sowie europäischen Werten anpasst.