
Heute gelten 99,999 Prozent der geschätzten 1 Billion Arten auf der Erde als mikrobiell – Bakterien, Archaeen, Viren und einzellige Eukaryoten. Während eines Großteils der Geschichte unseres Planeten herrschten Mikroben auf der Erde, die in der Lage waren, in den extremsten Umgebungen zu leben und zu gedeihen. Forscher haben erst in den letzten Jahrzehnten damit begonnen, sich mit der Vielfalt der Mikroben auseinanderzusetzen – Schätzungen zufolge haben weniger als 1 Prozent der bekannten Gene im Labor validierte Funktionen. Computergestützte Ansätze bieten Forschern die Möglichkeit, diese wirklich erstaunliche Menge an Informationen strategisch zu analysieren.
Ein ausgebildeter Umweltmikrobiologe und Informatiker, neues MIT-Fakultätsmitglied Yunha Hwang interessiert sich für die neuartige Biologie, die die vielfältigste und produktivste Lebensform auf der Erde offenbart. In einer gemeinsamen Fakultätsposition als Samuel A. Goldblith Profession Improvement Professor in der Fachbereich Biologie, sowie als Assistenzprofessor an der Fachbereich Elektrotechnik und Informatik und die MIT Schwarzman Faculty of ComputingHwang erforscht die Schnittstelle zwischen Informatik und Biologie.
Q: Was hat Sie dazu bewogen, Mikroben in extremen Umgebungen zu erforschen, und was sind die Herausforderungen bei ihrer Untersuchung?
A: Excessive Umgebungen sind großartige Orte, um nach interessanter Biologie zu suchen. Als ich aufwuchs, wollte ich Astronaut werden, und der Astrobiologie kommt die Untersuchung extremer Umgebungen auf der Erde am nächsten. Und das Einzige, was in diesen extremen Umgebungen lebt, sind Mikroben. Während einer Probenahmeexpedition, an der ich vor der Küste Mexikos teilnahm, entdeckten wir etwa zwei Kilometer unter Wasser eine bunte Mikrobenmatte, die gedieh, weil die Bakterien Schwefel statt Sauerstoff atmeten – aber keiner der Mikroben, die ich zu untersuchen hoffte, würde im Labor wachsen.
Die größte Herausforderung bei der Untersuchung von Mikroben besteht darin, dass die meisten von ihnen nicht kultiviert werden können, was bedeutet, dass die einzige Möglichkeit, ihre Biologie zu untersuchen, eine Methode namens Metagenomik ist. Meine neueste Arbeit ist die Modellierung genomischer Sprache. Wir hoffen, ein Computersystem zu entwickeln, mit dem wir den Organismus so weit wie möglich „in silico“ untersuchen können, indem wir einfach Sequenzdaten verwenden. Ein genomisches Sprachmodell ist technisch gesehen ein großes Sprachmodell, mit der Ausnahme, dass die Sprache im Gegensatz zur menschlichen Sprache DNA ist. Es wird auf ähnliche Weise trainiert, nur in biologischer Sprache und nicht in Englisch oder Französisch. Wenn es unser Ziel ist, die Sprache der Biologie zu lernen, sollten wir die Vielfalt mikrobieller Genome nutzen. Obwohl wir über viele Daten verfügen und immer mehr Proben verfügbar werden, haben wir gerade erst an der Oberfläche der mikrobiellen Vielfalt gekratzt.
Q: Wie kann die Untersuchung von Mikroben in silico mithilfe der genomischen Sprachmodellierung unser Verständnis des mikrobiellen Genoms verbessern, wenn man bedenkt, wie vielfältig Mikroben sind und wie wenig wir über sie wissen?
A: Ein Genom besteht aus vielen Millionen Buchstaben. Ein Mensch kann das unmöglich betrachten und daraus einen Sinn ziehen. Wir können jedoch eine Maschine so programmieren, dass sie Daten in nützliche Teile segmentiert. So funktioniert die Bioinformatik mit einem einzelnen Genom. Aber wenn man sich ein Gramm Boden anschaut, der Tausende einzigartiger Genome enthalten kann, sind das einfach zu viele Daten, um damit zu arbeiten – ein Mensch und ein Pc sind zusammen erforderlich, um mit diesen Daten klarzukommen.
Während meiner Doktorarbeit und meines Masterstudiums entdeckten wir gerade erst neue Genome und neue Abstammungslinien, die sich so sehr von allem unterschieden, was im Labor charakterisiert oder gezüchtet worden struggle. Das waren Dinge, die wir einfach „mikrobielle dunkle Materie“ nannten. Wenn es viele uncharakterisierte Dinge gibt, kann maschinelles Lernen wirklich nützlich sein, weil wir nur nach Mustern suchen – aber das ist nicht das Endziel. Wir hoffen, diese Muster auf evolutionäre Beziehungen zwischen jedem Genom, jeder Mikrobe und jeder Lebensinstanz abzubilden.
Bisher haben wir Proteine als eine eigenständige Einheit betrachtet – das bringt uns zu einem guten Maß an Informationen, da Proteine durch Homologie miteinander verwandt sind und daher evolutionär verwandte Dinge möglicherweise eine ähnliche Funktion haben.
Über die Mikrobiologie ist bekannt, dass Proteine in Genomen kodiert sind und der Kontext, in dem dieses Protein gebunden ist – welche Regionen davor und danach liegen – evolutionär konserviert ist, insbesondere wenn eine funktionelle Kopplung besteht. Das ist absolut sinnvoll, denn wenn Sie drei Proteine haben, die zusammen exprimiert werden müssen, weil sie eine Einheit bilden, möchten Sie sie möglicherweise direkt nebeneinander platzieren.
Was ich tun möchte, ist, mehr von diesem genomischen Kontext in die Artwork und Weise einzubeziehen, wie wir nach Proteinen suchen und diese annotieren und die Funktion von Proteinen verstehen, sodass wir über Sequenz- oder Strukturähnlichkeiten hinausgehen und Kontextinformationen hinzufügen können, um zu verstehen, wie wir Proteine verstehen und Hypothesen über ihre Funktionen aufstellen.
Q: Wie lässt sich Ihre Forschung nutzen, um das funktionelle Potenzial von Mikroben zu nutzen?
A: Mikroben sind möglicherweise die besten Chemiker der Welt. Die Nutzung des mikrobiellen Stoffwechsels und der Biochemie wird zu nachhaltigeren und effizienteren Methoden zur Herstellung neuer Materialien, neuer Therapeutika und neuer Polymertypen führen.
Aber es geht nicht nur um Effizienz – Mikroben betreiben Chemie, über die wir nicht einmal nachdenken können. Wenn wir darüber nachdenken, wie sich unsere Welt und unser Klima verändern, wird es auch sehr wichtig sein, zu verstehen, wie Mikroben funktionieren, und in der Lage zu sein, ihren genomischen Aufbau und ihre Funktionsfähigkeit zu verstehen. Ein Großteil der Kohlenstoffbindung und des Nährstoffkreislaufs wird von Mikroben übernommen; Wenn wir nicht verstehen, wie eine bestimmte Mikrobe Stickstoff oder Kohlenstoff binden kann, werden wir Schwierigkeiten haben, die Nährstoffflüsse der Erde zu modellieren.
Auf der therapeutischeren Seite stellen Infektionskrankheiten eine reale und wachsende Bedrohung dar. Wenn wir über die Zukunft und die Bekämpfung mikrobieller Krankheitserreger nachdenken, ist es wirklich wichtig zu verstehen, wie sich Mikroben in unterschiedlichen Umgebungen im Vergleich zum Relaxation unseres Mikrobioms verhalten.
