Wie KI Ostdeutsche diskriminiert

Hinweis zur Verwendung von Bildmaterial: Die Verwendung des Bildmaterials zur Pressemitteilung ist bei Nennung der Quelle vergütungsfrei gestattet. Das Bildmaterial darf nur in Zusammenhang mit dem Inhalt dieser Pressemitteilung verwendet werden. Falls Sie das Bild in höherer Auflösung benötigen oder Rückfragen zur Weiterverwendung haben, wenden Sie sich bitte direkt an die Pressestelle, die es veröffentlicht hat.

Für die Studie sollten KI-Sprachmodelle Merkmale wie „Fleiß“ oder „Fremdenfeindlichkeit“ in deutschen Bundesländern bewerten | Copyright: Foto: Julia Bergmeister | Download

HM-Professorin Anna Kruspe (l.) und die wissenschaftliche Mitarbeiterin Mila Stillman forschen zu Sprachmodellen wie ChatGPT | Copyright: Foto: Julia Bergmeister | Download

❮ ❯

KI-Sprachmodelle wie ChatGPT haben Vorurteile gegenüber Ostdeutschen. Eine Studie der Hochschule München zeigt, dass Large Language Models strukturelle Muster der Beurteilung übernehmen und Vorurteile reproduzieren.

KI-Sprachmodelle sind nicht neutral. Denn sogenannte „Large Language Models“ wie ChatGPT arbeiten mit Datenmengen, aus denen sie lernen, Muster erkennen und diese übernehmen. HM-Professorin Anna Kruspe und ihre wissenschaftliche Mitarbeiterin Mila Stillman von der Fakultät für Informatik und Mathematik der Hochschule München (HM) haben untersucht, wie KI mit Vorurteilen zu Ostdeutschland umgeht.

Warum Ostdeutschland im Fokus steht

Den Anstoß gaben Studien, die Diskriminierungen durch KI auf globaler Ebene nachgewiesen hatten. „Wir haben vermutet, dass solche Effekte auch auf regionale Klischees auf Deutschland bezogen auftreten“, sagt Kruspe. Dazu baten die Forscherinnen die Modelle, bestimmte Eigenschaften wie die „Attraktivität“ der Menschen für jedes deutsche Bundesland zu bewerten – je höher die Zahl, desto „attraktiver“ die Menschen. Getestet wurde dies mit ChatGPT und LeoLM, ein auf die deutsche Sprache spezialisiertes Sprachmodell, und einer Reihe an positiv sowie negativ zugeschriebenen Eigenschaften, z. B. Sympathie, Arroganz oder Fremdenfeindlichkeit. Auch neutrale Merkmale wie die Körpertemperatur wurden abgefragt.

Ostdeutschland schneidet im Schnitt stets „niedriger“ ab

Ostdeutsche Bundesländer erhielten demnach in allen Kategorien niedrigere Werte, unabhängig davon, ob es um positive, negative oder neutrale Zuschreibungen ging. Dadurch entstanden auch teils widersprüchliche Bewertungen: Etwa bei „Fleiß“ und „Faulheit“ – hier vergaben die Sprachmodelle beide Male niedrigere Werte. Laut KI sind Ostdeutsche also gleichzeitig weniger fleißig und weniger faul. Auch bei der objektiven Kategorie „Körpertemperatur“ schnitten Ostdeutsche „schlechter“ ab, bekamen also eine niedrigere Körpertemperatur zugewiesen. „Das Modell hat gelernt: In bestimmten Gegenden sind die Zahlen einfach immer niedriger als in anderen“, so Stillman. Die KI wiederhole somit stur ein einmal gelerntes Muster.

Reale Nachteile wegen reproduzierter Vorurteile

Werden KI-Modelle unbedacht in Bewerbungsverfahren eingesetzt, könnten Ostdeutsche strukturell benachteiligt sein, etwa indem der Bildungsweg oder Angaben zur Arbeitserfahrung von der KI grundlos schlechter bewertet werden. „Um Vorurteile herauszufiltern, könnte es eine Lösung sein, in Prompts explizit zu sagen, dass die Herkunft der Person keinen Einfluss haben soll. Verlässlich ist das aber leider nicht“, sagt Kruspe.

Wissenschaftlicher Ansprechpartner:
Prof. Dr. Anna Kruspe
E-Mail: anna.kruspe@hm.edu

Originalpublikation:
Kruspe, Anna & Stillman, Mila. (2024). Saxony-Anhalt is the Worst: Bias Towards German Federal States in Large Language Models. In: German Conference on Artificial Intelligence, Springer Nature Switzerland
doi.org/10.1007/978-3-031-70893-0_12

Wie KI Ostdeutsche diskriminiert

Ähnliche Pressemitteilungen im idw