Open Source: Bioinformatik-Tools aus Jena erleichtern Phagen-Detektion und PCR-Design
In zwei wissenschaftlichen Publikationen haben InfectoGnostics-Forscher kürzlich neue bioinformatische Tools vorgestellt, deren Open-Source-Code nun kostenlos genutzt und weiterentwickelt werden kann. Die Software "What the Phage" ermöglicht die Detektion von Phagen, während "ConsensusPrime" für die Entwicklung von verschiedenen molekularen Tests genutzt werden kann. Entwickelt wurden die Tools von Forschern des Universitätsklinikums Jena (UKJ), des Leibniz-Instituts für Photonische Technologien (Leibniz-IPHT) sowie des Startups nanozoo.
Bakteriophagen, kurz Phagen, sind Viren, die Bakterien befallen und deshalb in den letzten Jahren wieder stärker in den Fokus für therapeutische Anwendungen gelangt sind. Gerade bei antibiotikaresistenten Erregern könnten Phagentherapien eine vielversprechende Option darstellen. Bis heute sind allerdings Phagen und ihr Einfluss auf Mikrobiome in der Umwelt und im Menschen noch wenig erforscht.
„Obwohl mehr und mehr Daten von sequenzierten Mikroorganismen vorliegen, wird bislang nicht systematisch untersucht, welche Phagen auftreten. Zur Lösung dieses Problems haben wir gemeinsam mit den Kollegen von nanozoo und dem Leibniz-IPHT What the Phage entwickelt. Die Software bietet einen Workflow, der mittels maschinellen Lernens und anderen Algorithmen Phagen detektieren und mögliche neue Varianten aus Sequenzdaten vorhersagen kann“, erläutert Mike Marquet, UKJ-Forscher und Hauptautor der kürzlich in „GigaScience“ veröffentlichten Publikation zu What the Phage.
Bei What the Phage wurden dafür mehrere Programme zu einem Workflow vereint und für eine möglichst schnelle und einfache Auswertung des Nutzers optimiert. Dabei haben die Forscher bewusst auf ein modulares Open-Source-Prinzip gesetzt, wie Mike Marquet weiter ausführt: „Wir wollen, dass der Workflow kontinuierlich erweitert und verbessert wird. Denkbar sind zum Beispiel Vorhersagen für Prophagen. Andere Entwickler haben dazu bereits Code und weiteres Know-how beigetragen.“
-- ConsensusPrime erleichtert Primer-Design für neue PCR-Tests --
Die PCR, die Polymerase-Kettenreaktion, gilt als der methodische Goldstandard für exakte molekulare Labortests in der Infektiologie. Erbgut-Abschnitte, die charakteristisch für den gesuchten Erreger sind, können mit dem molekularbiologischen Verfahren vervielfältigt und so nachgewiesen werden.
Doch damit das namensgebende Enzym – die DNA-Polymerase – ‚weiß‘, welche DNA-Abschnitte sie vervielfältigen muss, designen Wissenschaftler sogenannte „Primer“ – kurze DNA-Abschnitte, an denen die Polymerase bindet. Mit ConsensusPrime haben Wissenschaftler der Abteilung „Optisch-Molekulare Diagnostik und Systemtechnologie“ am Leibniz-IPHT ein Bioinformatik-Tool entwickelt, das eine schnelleres und effizienteres Design von Primern ermöglicht.
Beim Primer-Design stehen Forscher oft vor dem Problem, dass sie nicht nur einen einzigen, sondern mehrere sehr nah verwandte Erregerstämme nachweisen oder unterscheiden möchten. Zugleich muss ein Primer aber auch möglichst spezifisch an das Ziel-Erbgut angepasst sein. Man sucht in solchen Fällen deshalb oft nach einem sogenannten „Konsensus-Primer“: eine Sequenz, die die größte Ähnlichkeit zu mehreren Stämmen hat, sich aber dennoch optimal als Primer eignet.
„Ohne unsere Software muss man dafür meist händisch die Sequenzabschnitte heraussuchen, die Ähnlichkeiten aufweisen. Das ist nicht nur unpräzise, sondern bei großen Datenmengen kaum noch überschaubar und auch sehr zeitaufwendig. ConsensusPrime filtert unpassende Primer direkt aus und berechnet exakt die Erbgutabschnitte mit den größten Ähnlichkeiten. Mit unserer Pipeline erhalten wir so eine Konsensussequenz für den optimalen Primer“, erklärt Dr. Maximilian Collatz, Leibniz-IPHT-Forscher und Hauptautor der Publikation in „Biomedinformatics“.
Originalpublikation:
What the Phage | https://github.com/replikation/What_the_Phage
Mike Marquet, Martin Hölzer, Mathias W Pletz, Adrian Viehweger, Oliwia Makarewicz, Ralf Ehricht, Christian Brandt. 2022. What the Phage: a scalable workflow for the identification and analysis of phage sequences, GigaScience, Volume 11, giac110.
DOI: 10.1093/gigascience/giac110
ConsensusPrime | https://github.com/mcollatz/ConsensusPrime
Maximilian Collatz, Sascha D. Braun, Stefan Monecke, and Ralf Ehricht. 2022. "ConsensusPrime—A Bioinformatic Pipeline for Ideal Consensus Primer Design" BioMedInformatics 2, no. 4: 637-642.
DOI: 10.3390/biomedinformatics2040041
Weitere Informationen:
https://www.infectognostics.de/aktuelles/open-source-bioinformatik-tools