Graduiertenkolleg der TU Darmstadt erforscht neue Methoden des maschinellen Lernens
Darmstadt, 8. November 2016. Die Menge an Daten, die täglich auf Nachrichtenseiten, in sozialen Netzwerken und Blogs publiziert werden, ist für Menschen schon lange nicht mehr überschaubar. Daher erforschen Wissenschaftler im Graduiertenkolleg AIPHES an der TU Darmstadt neue Methoden, um die gewaltigen Mengen an Daten aufzubereiten und so für Menschen nutzbar zu machen. Ihr Ziel ist es, Verfahren zu entwickeln, die aus verschiedensten Quellen und zu unterschiedlichsten Themen automatisiert Zusammenfassungen erstellen können.
Eine zentrale Herausforderung bei der Erstellung einer Zusammenfassung ist die Bewertung der Wichtigkeit von Informationen. Welche Informationen sollen in der Zusammenfassung enthalten sein? Welche sind nebensächlich und können weggelassen werden? Welche Informationen sind allgemein bekannt und müssen daher nicht in die Zusammenfassung? Was für Menschen im Einzelnen einfach ist, ist für Computer eine schwere Aufgabe. Das natürliche Verständnis für Sprache, das Menschen nutzen, um Zusammenfassungen zu erstellen, fehlt dem Computer bisher. Die Wissenschaftler entwickeln daher Verfahren, um Computern dieses Verständnis zu vermitteln.
Es ist dabei nicht möglich, einem Computer detailliert zu beschreiben, wie Zusammenfassungen erstellt werden. Solche Kondensate sind eine komplexe Aufgabe, deren Ablauf sich nicht mit einem festen Schema beschreiben lässt. Je nach Thema sind andere Aspekte wichtig und zukünftige interessante Themen sind nicht vorhersehbar. Wer hätte vor einem Jahr gedacht, dass Menschen an einer Zusammenfassung zum Thema „VW-Abgasskandal“ interessiert sein werden?
Daher erforschen die Darmstädter Methoden des maschinellen Lernens und der automatischen Sprachverarbeitung, um Computer zu befähigen, die Bewältigung der Aufgabe selbständig zu erlernen. Genau wie Hunden ein bestimmtes Verhalten antrainiert werden kann, trainieren die Wissenschaftler Computer. Der Nachwuchswissenschaftler Markus Zopf instruierte so einen Computer mit Hilfe von 100.000 Paaren von Nachrichtenartikeln und dafür geschriebenen Zusammenfassungen (https://aclweb.org/anthology/K/K16/K16-1009.pdf). Der Computer kann mithilfe eines neu entwickelten Verfahrens aus diesen Daten selbständig lernen, welche Informationen wichtig sind und das gelernte Wissen auf neue Texte anwenden. Zopfs Kollege Maxime Peyrard hat in seiner Arbeit (https://aclweb.org/anthology/P/P16/P16-1172.pdf) gezeigt, dass es ausreicht, die Wichtigkeit einzelner Sätze anstatt kompletter Zusammenfassungen zu bewerten, um gute Zusammenfassungen zu erstellen. Dadurch wird ein komplexes Problem auf mehrere kleinere Probleme aufgeteilt und somit leichter lösbar.
Hintergrund:
Interview mit Dr. Christian M. Meyer, Wissenschaftler am Ubiquitous Knowledge Processing Lab, Fachbereich Informatik der TU Darmstadt:
„Wie Journalisten und Medienredaktionen von der Textverarbeitungs-Forschung profitieren könnten“ unter http://bit.ly/2eI9xdO
„Das Graduiertenkolleg AIPHES betreibt Grundlagenforschung zur automatischen Textanalyse, Strukturerfassung und Zusammenfassung von Informationen, die für zahlreiche praktische Anwendungen relevant sind. Gerade im Journalismus ist eine rein manuelle Auswertung kaum mehr praktikabel, da Recherchen unter sehr engen Zeitvorgaben stattfinden und dennoch eine schier explodierende Datenmenge bereitsteht, die aus hochgradig heterogenen Quellen unterschiedlichster Informationsqualität stammt. Effektive Informationsaufbereitung ist also erfolgsentscheidend für journalistische Tätigkeiten.“ (Dr. Christian M. Meyer)
Info: AIPHES – Daten und Fakten
Das Graduiertenkolleg AIPHES („Adaptive Informationsaufbereitung aus heterogenen Quellen“) im Fachbereich Informatik an der TU Darmstadt wird seit April 2015 von der Deutschen Forschungsgemeinschaft gefördert. Die Leitung hat Prof. Dr. Iryna Gurevych inne. Beteiligte Partner sind die Universität Heidelberg und das Heidelberger Institut für Theoretische Studien (HITS). Insgesamt elf Promovierende sowie etwa ebenso viele assoziierte Wissenschaftlerinnen und Wissenschaftler erforschen neuartige Methoden zur Aufbereitung heterogener Quellen aus den fachlichen Perspektiven der informatikorientierten Sprachtechnologie, der Computerlinguistik, des maschinellen Lernens und des Informationsmanagements. Zentrale Fragestellungen des Kollegs betreffen die Recherche, die Informationsqualität sowie die computerunterstützte Navigation, Strukturierung und Auswertung von textuellen Informationen. Neben methodischen Zielen evaluiert das Kolleg das Potential neuartiger Ansätze für aktuelle und zukünftige Anwendungen im Journalismus.
Kontakt:
Prof. Dr. Iryna Gurevych
Tel.: 06151/16-25290 , E-Mail: gurevych@ukp.informatik.tu-darmstadt.de
www.aiphes.tu-darmstadt.de
MI-Nr. 73/2016, GRK 1994/feu
Weitere Informationen:
http://www.aiphes.tu-darmstadt.de Graduiertenkolleg AIPHES
http://bit.ly/2eI9xdO ergänzendes Interview zur Pressemitteilung
Die semantisch ähnlichsten Pressemitteilungen im idw
