Es wurden viele Versuche unternommen, die Kraft neuer künstlicher Intelligenz und großer Sprachmodelle (LLMs) zu nutzen, um zu versuchen, die Ergebnisse neuer chemischer Reaktionen vorherzusagen. Diese hatten nur begrenzten Erfolg, teilweise, weil sie bisher nicht auf ein Verständnis grundlegender physikalischer Prinzipien wie den Gesetzen der Massenerhaltung beruhten. Jetzt hat ein Crew von Forschern am MIT eine Möglichkeit gefunden, diese physikalischen Einschränkungen in ein Reaktionsvorhersagemodell einzubeziehen und somit die Genauigkeit und Zuverlässigkeit seiner Outputs erheblich zu verbessern.

Die neue Arbeit battle gemeldet am 20. August in der Zeitschrift Naturin einer Zeitung von jüngsten Postdoc Joonyoung Joung (heute Assistenzprofessor an der Kookmin College, Südkorea); ehemaliger Softwareingenieur Mun Hong Fong (jetzt an der Duke College); Studentin des Chemieingenieurwesens Nicholas Casetti; Postdoc Jordan Liles; Physics Scholar Scholar Ne Dassanayake; und Senior -Autor Connor Coley, die Klasse von 1957 Karriereentwicklungsprofessor in den MIT -Abteilungen für Chemieingenieurwesen, Elektrotechnik und Informatik.

„Die Vorhersage der Reaktionsergebnisse ist eine sehr wichtige Aufgabe“, erklärt Joung. Wenn Sie beispielsweise ein neues Medikament herstellen möchten, müssen Sie „wissen, wie es hergestellt werden soll. Daher müssen wir wissen, welches Produkt wahrscheinlich ist“, um aus einem bestimmten Satz chemischer Inputs zu einer Reaktion zu resultieren. Die meisten früheren Bemühungen, solche Vorhersagen durchzuführen, befassen sich jedoch nur mit einer Reihe von Eingängen und einer Reihe von Ausgängen, ohne die Zwischenschritte zu betrachten oder die Einschränkungen der Sicherstellung zu berücksichtigen, dass keine Masse gewonnen oder verloren geht, was bei tatsächlichen Reaktionen nicht möglich ist.

Joung weist darauf hin, dass Großsprachmodelle wie ChatGPT in vielen Forschungsbereichen sehr erfolgreich waren, diese Modelle jedoch keine Möglichkeit bieten, ihre Ergebnisse auf physikalisch realistische Möglichkeiten zu beschränken, beispielsweise indem sie sie an die Erhaltung der Massenerhaltung halten. Diese Modelle verwenden rechnerische „Token“, die in diesem Fall einzelne Atome darstellen. „Wenn Sie jedoch die Token nicht bewahren, beginnt das LLM -Modell, neue Atome herzustellen oder Atome in der Reaktion zu löschen.“ Anstatt auf ein reales wissenschaftliches Verständnis begründet zu sein: „Dies ist eine Artwork Alchemie“, sagt er. Während viele Versuche, die Reaktionsvorhersage zu erwirtschaften, nur die Endprodukte „Wir möchten alle Chemikalien verfolgen und wie die Chemikalien während des gesamten Reaktionsprozesses von Anfang bis Ende transformiert werden“, sagt er.

Um das Drawback anzugehen, verwendete das Crew eine Methode, die in den 1970er Jahren von Chemikern Ivar UGI entwickelt wurde und die eine Bond-Elektronenmatrix verwendet, um die Elektronen in einer Reaktion darzustellen. Sie verwendeten dieses System als Grundlage für ihr neues Programm namens Flower (Movement -Matching für die Umverteilung von Elektronen), mit der sie alle Elektronen in der Reaktion explizit verfolgen können, um sicherzustellen, dass keiner in diesem Prozess fehlerhaft hinzugefügt oder gelöscht wird.

Das System verwendet eine Matrix, um die Elektronen in einer Reaktion darzustellen, und verwendet Werte ungleich Null, um Bindungen oder einsame Elektronenpaare und Nullen darzustellen, um einen Mangel darzustellen. „Das hilft uns, gleichzeitig Atome und Elektronen zu sparen“, sagt Fong. Diese Darstellung sei eines der Schlüsselelemente für die Einbeziehung der Massenkonservierung in ihr Vorhersagesystem.

Das von ihnen entwickelte System ist noch in einem frühen Stadium, sagt Coley. „Das System, das soweit ist, ist eine Demonstration – ein Beweis für das Konzept, dass dieser generative Ansatz der Flussanpassung sehr intestine für die Aufgabe der chemischen Reaktionsvorhersage geeignet ist.“ Während das Crew über diesen vielversprechenden Ansatz begeistert ist, sagt er: „Wir sind uns bewusst, dass es spezifische Einschränkungen für die Breite verschiedener Chemikalien hat, die es gesehen hat.“ Obwohl das Modell unter Verwendung von Daten zu mehr als einer Million chemischen Reaktionen geschult wurde, die aus einer US -Patentbürodatenbank erhalten wurden, enthalten diese Daten keine bestimmten Metalle und einige Arten von katalytischen Reaktionen, sagt er.

„Wir freuen uns unglaublich darüber, dass wir so zuverlässige Vorhersagen chemischer Mechanismen erhalten können“, sagt er. „Es konserviert die Masse, es konserviert Elektronen, aber wir erkennen sicher an, dass es auch in den kommenden Jahren viel mehr Enlargement und Robustheit gibt.“

Aber selbst in seiner gegenwärtigen Kind, die über den On-line -Plattform Github frei verfügbar ist, „denken wir, dass es genaue Vorhersagen machen und als Instrument zur Bewertung der Reaktivität und zur Kartierung von Reaktionswegen hilfreich sein wird“, sagt Coley. „Wenn wir uns mit der Zukunft befassen, den Stand der Kunst des mechanistischen Verständnisses wirklich voranzutreiben und neue Reaktionen zu erfinden, sind wir nicht ganz da. Aber wir hoffen, dass dies ein Sprungbrett dafür sein wird.“

„Es ist alles Open Supply“, sagt Fong. „Die Modelle, die Daten, alle sind dort oben“, einschließlich eines früheren Datensatzes, der von Joung entwickelt wurde, das die mechanistischen Schritte bekannter Reaktionen umfassend auflistet. „Ich denke, wir sind eine der wegweisenden Gruppen, die diesen Datensatz herstellen und es offen zur Verfügung stellen und dies für alle verwendbar machen“, sagt er.

Das Blumenmodell entspricht oder übertrifft vorhandene Ansätze bei der Suche nach Standardmechanistikwegen, so das Crew, und ermöglicht es, auf bisher unsichtbare Reaktionstypen zu verallgemeinern. Sie sagen, das Modell könnte möglicherweise für die Vorhersage von Reaktionen auf medizinische Chemie, Materialentdeckung, Verbrennung, atmosphärische Chemie und elektrochemische Systeme related sein.

In ihren Vergleiche mit vorhandenen Reaktionsvorhersagesystemen sagt Coley: „Mit den von uns getroffenen Architekturentscheidungen erhalten wir diese large Zunahme von Gültigkeit und Erhaltung und erhalten eine passende oder ein wenig bessere Genauigkeit in Bezug auf die Leistung.“

Er fügt hinzu, dass „das Einzigartige an unserem Ansatz ist, dass wir, während wir diese Lehrbuchverständnisse von Mechanismen verwenden, um diesen Datensatz zu generieren, die Reaktanten und Produkte der Gesamtreaktion in experimentell validierten Daten aus der Patentliteratur verankern.“ Sie schließen die zugrunde liegenden Mechanismen ab, sagt er, anstatt sie nur zu erfinden. „Wir bringen sie aus experimentellen Daten ab, und das wurde nicht in dieser Artwork von Größenordnung getan und geteilt.“

Der nächste Schritt, sagt er, ist „Wir sind sehr daran interessiert, das Verständnis des Modells von Metallen und katalytischen Zyklen zu erweitern. Wir haben gerade die Oberfläche in diesem ersten Papier zerkratzt“ und die meisten der bisher enthaltenen Reaktionen enthalten keine Metalle oder Katalysatoren.

Langfristig sagt er: „Ein Großteil der Aufregung besteht darin, diese Artwork von System zu verwenden, um neue komplexe Reaktionen zu entdecken und neue Mechanismen aufzuklären. Ich denke, dass die langfristigen potenziellen Auswirkungen groß sind, aber dies ist natürlich nur ein erster Schritt.“

Die Arbeit wurde durch das maschinelle Lernen für pharmazeutische Entdeckungen und Synthesekonsortium und die Nationwide Science Basis unterstützt.

Von admin

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert