Das Wissen der Welt erweitern
Suchmaschinen sind auf vernetzte Daten angewiesen. Aber auch für die Forschung bieten sie ein enormes Potenzial. Ein neuer Verbund der Universität Trier hat ein ehrgeiziges Ziel.
Generative Sprachmodelle wie ChatGPT werden nicht nur auf großen Mengen an Text trainiert, sondern auch mit vernetzten Daten. Von Anfang an hat sich das Trier Center for Digital Humanities (TCDH) hier Expertise aufgebaut. Nun ist mit „LODinG – Linked Open Data in den Geisteswissenschaften“ unter Federführung des TCDH ein neuer Verbund gestartet, der zu verlinkten Daten – und damit nicht weniger als dem Wissen der Welt – forscht. Dieses soll erweitert, verfeinert und für die Beantwortung vielfältiger Fragen genutzt werden.
Reden von Politikern, Fotos von geschichtlichen Ereignissen oder Videoaufnahmen von Kulturveranstaltungen – immer mehr Daten sind heute digital verfügbar. Wenn diese Daten miteinander vernetzt sind und auch in einer maschinenlesbaren Form vorliegen – also von Software oder Künstlicher Intelligenz verarbeitet werden können – kann daraus neues Wissen generiert werden. Im Rahmen ihres Verbundvorhabens sammeln und erschließen die Forschenden Daten und machen sie frei verfügbar. Beispielsweise verknüpfen sie Texte mit Lebensdaten von Personen oder fügen Bildern Geokoordinaten hinzu, und zwar sowohl manuell als auch automatisch.
In insgesamt sieben Teilprojekten wird zu sogenannten Linked Open Data geforscht. Ein Projekt beschäftigt sich mit historischen Weinetiketten. Die Bilder und Texte auf Weinetiketten erzählen ihre ganz eigene Geschichte, wie Wein vermarket wurde. Gleichzeitig sind sie Spiegelbild der Wirtschaft, Kultur und Sprache vergangener Jahrzehnte und Jahrhunderte. Das Projekt digitalisiert die Weinetiketten und bereitet die Daten unter anderem mithilfe von Künstlicher Intelligenz durch die Verwendung eines standardisierten Vokabulars so auf, dass sie maschinenlesbar sind. Die Daten werden für alle zugänglich veröffentlicht, sodass Interessierte und andere Wissenschaftlerinnen und Wissenschaftler diese wiederum für ihre eigenen Forschungsprojekte nutzen können.
„Wir möchten zeigen, dass Linked Open Data geisteswissenschaftliche Forschung voranbringt“, sagt Prof. Dr. Christof Schöch, Leiter des Verbundes. Co-Sprecherin Prof. Dr. Claudine Moulin ergänzt: „Unser Ziel ist es jedoch, nicht nur Daten, sondern auch Forschungsgebiete zu vernetzen.“ So forschen die Beteiligten in den Teilprojekten des Verbunds zu ganz unterschiedlichen Themen, von medizinischen Abhandlungen der Frühen Neuzeit bis zu aktuellen EU-Rechtstexten. Neben Wissenschaftlerinnen und Wissenschaftlern der Digital Humanities und Computerlinguistik, der Germanistik, der Romanistik und der Sinologie sind auch die Fächer Informatikwissenschaften und Rechtswissenschaften am Forschungsverbund beteiligt.
„In Deutschland hat sich das TCDH im Bereich der digitalen Vernetzung von Daten bereits einen Namen gemacht. Der Verbund gibt uns nun die Chance, auch international noch präsenter zu werden“, sagt Co-Sprecherin JProf. Dr. Susanne Kabatnik. Insgesamt fünf Jahre haben die Forschenden dank der Förderung durch die Forschungsinitiative des Landes Rheinland-Pfalz hierfür Zeit. Man wird sicher noch Einiges von ihnen hören.
Mehr Infos zum Forschungsverbund: https://tcdh.uni-trier.de/de/projekt/loding
Wissenschaftlicher Ansprechpartner:
Prof. Dr. Christof Schöch
Trier Center for Digital Humanities
Mail: schoech@uni-trier.de
Tel. +49 651 201-3264