Maschinelles Lernen um niedermolekulare Verbindungen zu untersuchen
Ein neues Instrument zur Identifizierung niedermolekularer Verbindungen bietet Vorteile für Diagnostik, Arzneimittelentdeckung und Grundlagenforschung. Ein neues Modell des maschinellen Lernens wird Wissenschaftlern helfen, niedermolekulare Verbindungen zu identifizieren, die in der Medizin, der Arzneimittelentwicklung und der Umweltchemie Anwendung finden. Das von Forschern der Aalto-Universität und der Universität Luxemburg entwickelte Modell wurde mit Daten aus Dutzenden von Laboren trainiert, um zu einem der genauesten Werkzeuge zur Identifizierung niedermolekularer Verbindungen zu werden.
Tausende verschiedener niedermolekularer Verbindungen, so genannte Metaboliten, transportieren Energie und übermitteln zelluläre Informationen im gesamten menschlichen Körper. Da sie so klein sind, lassen sich Metaboliten bei der Analyse von Blutproben nur schwer voneinander unterscheiden. Die Identifizierung dieser Moleküle ist jedoch wichtig, um zu verstehen, wie Bewegung, Ernährung, Alkoholkonsum und Stoffwechselstörungen unser Wohlbefinden beeinflussen.
Metaboliten werden in der Regel durch die Analyse ihrer Masse und Retentionszeit mit einer Trenntechnik namens Flüssigkeitschromatographie und anschließender Massenspektrometrie identifiziert. Bei dieser Technik werden die Metaboliten zunächst getrennt, indem die Probe durch eine Säule geleitet wird, was zu unterschiedlichen Flussraten - oder Retentionszeiten - durch das Messgerät führt. Die Massenspektrometrie wird dann zur Feinabstimmung des Identifizierungsprozesses eingesetzt, indem die Metaboliten nach ihrer Masse sortiert werden. Mit der so genannten Tandem-Massenspektrometrie können die Forscher die Metaboliten auch in kleinere Teile zerlegen, um ihre Zusammensetzung zu analysieren.
"Selbst die besten Methoden können nicht mehr als 40 % der Moleküle in den Proben identifizieren, ohne zusätzliche Annahmen über die Moleküle zu treffen", sagt Professor Juho Rousu von der Aalto-Universität.
Nun hat Rousus Gruppe ein neuartiges maschinelles Lernmodell zur Identifizierung niedermolekularer Verbindungen entwickelt. Es wurde kürzlich in Nature Machine Intelligence veröffentlicht.
"Dieses neue Open-Source-Modell bietet der gesamten Forschungsgemeinschaft einen erweiterten Überblick über niedermolekulare Verbindungen. Es kann die Erforschung von Methoden zur Erkennung von Stoffwechselstörungen wie Diabetes oder sogar Krebs unterstützen", sagt Rousu.
Der neue Ansatz umgeht auf elegante Weise eine der Herausforderungen, mit denen herkömmliche Methoden konfrontiert sind. Da die Retentionszeiten der Moleküle von Labor zu Labor variieren, können die Daten nicht zwischen den Labors verglichen werden. Eric Bach, Doktorand an der Aalto-Universität, hat während seiner Doktorarbeit eine Alternative entwickelt, die das Problem löst.
„Unsere Forschung zeigt, dass die absoluten Retentionszeiten zwar variieren können, die Retentionsreihenfolge bei Messungen in verschiedenen Labors jedoch stabil ist", erklärt Bach. „Dadurch konnten wir zum ersten Mal alle öffentlich verfügbaren Daten zu Metaboliten zusammenführen und in unser maschinelles Lernmodell einspeisen."
Dank der Einbeziehung von Daten aus Dutzenden von Labors auf der ganzen Welt ist das maschinelle Lernmodell genau genug, um zwischen spiegelbildlichen Molekülen, den so genannten stereochemischen Varianten, zu unterscheiden. Bislang waren Identifizierungswerkzeuge nicht in der Lage, stereochemische Varianten zu unterscheiden, und es wird erwartet, dass die neue Fähigkeit neue Wege bei der Entwicklung von Medikamenten und in anderen Bereichen eröffnen wird.
"Die Tatsache, dass die Verwendung der Stereochemie die Identifizierungsleistung verbessert, ist eine Offenbarung für alle Entwickler von Identifizierungsmethoden für Metaboliten", sagt Emma Schymanski, Professorin am Luxembourg Centre for Systems Biomedicine (LCSB) der Universität Luxemburg. "Diese Methode könnte auch zur Identifizierung von Mikroverunreinigungen in der Umwelt oder zur Charakterisierung neuer Metaboliten in Pflanzenzellen eingesetzt werden."
Wissenschaftlicher Ansprechpartner:
Prof. Juho Rousu - https://www.aalto.fi/en/people/juho-rousu
Associate Prof. Emma Schymanski - https://wwwen.uni.lu/lcsb/people/emma_schymanski
Originalpublikation:
https://doi.org/10.1038/s42256-022-00577-2