Künstliche Intelligenz wertet chemische Spektren in Minuten aus
Ein Forschungsteam der Friedrich-Schiller-Universität Jena, des Helmholtz-Zentrums Berlin für Materialien und Energie, des Helmholtz Institute for Polymers in Energy Applications Jena und des Schweizer Softwareunternehmens Zakodium Sárl hat eine Künstliche Intelligenz (KI) entwickelt, die aus den Rohdaten spektroskopischer Messungen passende Molekülstrukturen vorschlägt und deren Plausibilität bewertet. Dieses System ist offen zugänglich und wurde im Fachmagazin Nature Communications vorgestellt.
Herauszufinden, welche Substanz im Reagenzglas oder im Rundkolben tatsächlich entstanden ist, gehört zu den zentralen Aufgaben der Chemie. Gerade bei komplexen oder neuartigen Substanzen ist das jedoch sehr zeitintensiv, auch für erfahrene Fachleute.
„Wer ein Molekül herstellt, muss auch beweisen, welche chemische Struktur es hat“, sagt Dr. Kevin Jablonka von der Universität Jena. Er ergänzt: „In der Chemie werden dafür üblicherweise Messverfahren wie die Kernspinresonanz-Spektroskopie, Infrarot-Spektroskopie oder Massenspektrometrie genutzt. Jede dieser Methoden liefert Hinweise auf die Struktur, aber oftmals nur in begrenztem Umfang. Die vielen einzelnen Mess-Signale bilden daher eine Art chemisches Puzzle, das korrekt gelöst werden muss.“
Gerade bei neuartigen Molekülen, die noch nie beschrieben wurden, ist die Strukturanalyse oft eine Herausforderung, insbesondere da die Messdaten in der Praxis oft nicht ideal sind. „Verunreinigungen in der Substanz können eigene Signale erzeugen oder die Signale der eigentlichen Substanz überlagern“, erklärt Jablonka. „Hier hat unser System die Stärke, dass es gerade bei den routinemäßig sehr oft gemessenen Protonen-NMR-Spektren auch mit Verunreinigungen in der realen Substanz umgehen kann.“
Wie SECS arbeitet
„Das neue System SECS kombiniert zwei Verfahren der Künstlichen Intelligenz“, führt Adrian Mirza, Erstautor der Arbeit, aus. „Zunächst erlernt das Modell, Spektren und Molekülstrukturen in eine gemeinsame mathematische Darstellung zu übersetzen. Dann verfeinert ein evolutionärer Algorithmus die Treffer, indem er Molekülvorschläge Schritt für Schritt verändert, indem er Atome und Bindungen hinzufügt oder entfernt und immer wieder prüft, ob das Ergebnis besser zu den Messdaten passt.“
Am Ende wird eine Rangliste möglicher Strukturen präsentiert mit Ähnlichkeitswerten, basierend auf dem chemischen Kontext.
Vergleichbar mit erfahrenen Fachleuten
„In einem Benchmark-Test mit unterschiedlichen spektroskopischen Methoden schlug SECS die richtige Molekülstruktur in über 80 Prozent der Fälle an erster Stelle vor“, beschreibt Jablonka die Leistungsfähigkeit des Systems. Und auch im direkten Vergleich mit Menschen konnte es mithalten: „Wir baten in einer Pilotstudie Chemikerinnen und Chemiker, 20 anspruchsvolle NMR-Aufgaben zu lösen“, erläutert Jablonka. Das Ergebnis: Die KI erreichte eine Leistung, die mit der der teilnehmenden Fachleute vergleichbar war.
„Wir sehen SECS aber nicht als Ersatz für menschliche Expertise“, schränkt Mirza ein. „Das System kann eine sehr hilfreiche zweite Meinung liefern.“ Wenn die Vorschläge plausibel sind und hohe Werte erhalten, stärkt das entsprechend die Interpretation. „Wenn die Vorschläge dagegen weit von der erwarteten Molekülstruktur entfernt sind, kann es sich aber lohnen, noch einmal genauer hinzuschauen“, schließt Jablonka an.
Offenes Werkzeug für die Forschung
Der Quellcode, Modelldaten und eine Testversion der Anwendung sind öffentlich zugänglich. Die aktuelle Webversion ist nach Angaben aus dem Gespräch zunächst vor allem für die direkte Auswertung von eindimensionalen Protonen-NMR-Rohdaten ausgelegt, weitere Spektrentypen und komplexere Rohdaten sollen folgen.
Wissenschaftlicher Ansprechpartner:
Dr. Kevin Maik Jablonka
Institut für Organische Chemie und Makromolekulare Chemie der Friedrich-Schiller-Universität Jena
Humboldtstraße 10
07743 Jena
Tel.: 03641 / 948564
E-Mail: kevin.jablonka@uni-jena.de
Originalpublikation:
Adrian Mirza, Luc Patiny, Kevin Maik Jablonka: „End-to-end multimodal structure elucidation from raw spectra combining contrastive learning and evolutionary algorithms“. Nature Communications, 2026. DOI: 10.1038/s41467-026-73846-y
Ähnliche Pressemitteilungen im idw