Der Einsatz von KI zur Optimierung der Arzneimittelforschung nimmt explosionsartig zu. Forscher setzen Modelle des maschinellen Lernens ein, um unter Milliarden von Möglichkeiten diejenigen Moleküle zu identifizieren, die möglicherweise die Eigenschaften besitzen, nach denen sie bei der Entwicklung neuer Medikamente suchen.
Allerdings müssen dabei so viele Variablen berücksichtigt werden – vom Materialpreis bis hin zum Risiko, dass etwas schief geht –, dass es selbst dann, wenn Wissenschaftler KI einsetzen, keine leichte Aufgabe ist, die Kosten für die Synthese der besten Kandidaten abzuwägen.
Die unzähligen Herausforderungen bei der Ermittlung der besten und kosteneffizientesten Moleküle für Exams sind ein Grund dafür, dass die Entwicklung neuer Medikamente so lange dauert, und zugleich ein Hauptgrund für die hohen Preise verschreibungspflichtiger Medikamente.
Um Wissenschaftlern dabei zu helfen, kostenbewusste Entscheidungen zu treffen, entwickelten Forscher am MIT ein algorithmisches Framework zur automatischen Identifizierung optimaler Molekülkandidaten. Dies minimiert die Synthesekosten und maximiert gleichzeitig die Wahrscheinlichkeit, dass die Kandidaten die gewünschten Eigenschaften aufweisen. Der Algorithmus identifiziert auch die Materialien und experimentellen Schritte, die zur Synthese dieser Moleküle erforderlich sind.
Ihr quantitativer Rahmen, bekannt als Synthesis Planning and Rewards-based Route Optimization Workflow (SPARROW), berücksichtigt die Kosten der Synthese einer Cost von Molekülen auf einmal, da sich häufig mehrere Kandidaten aus denselben chemischen Verbindungen ableiten lassen.
Darüber hinaus erfasst dieser einheitliche Ansatz wichtige Informationen zum Moleküldesign, zur Vorhersage von Eigenschaften und zur Syntheseplanung aus On-line-Repositorys und weit verbreiteten KI-Instruments.
SPARROW unterstützt nicht nur Pharmaunternehmen bei der effizienteren Entwicklung neuer Medikamente, sondern könnte auch bei anderen Anwendungen zum Einsatz kommen, wie etwa bei der Erfindung neuer Agrarchemikalien oder der Entdeckung spezieller Materialien für die organische Elektronik.
„Die Auswahl von Verbindungen ist im Second eine Kunst – und manchmal ist sie eine sehr erfolgreiche Kunst. Aber da wir all diese anderen Modelle und prädiktiven Werkzeuge haben, die uns Informationen darüber geben, wie Moleküle funktionieren und wie sie synthetisiert werden könnten, können und sollten wir diese Informationen als Orientierung für unsere Entscheidungen nutzen“, sagt Connor Coley, der 1957 in den MIT-Abteilungen für Chemieingenieurwesen und Elektrotechnik und Informatik Assistenzprofessor für Karriereentwicklung und leitender Autor eines Artikels über SPARROW.
Coley wird an dem Papier von der Hauptautorin Jenna Fromer SM ’24 unterstützt. Die Forschung erscheint heute In Natur Computerwissenschaften.
Komplexe Kostenbetrachtungen
In gewisser Weise läuft die Frage, ob ein Wissenschaftler ein bestimmtes Molekül synthetisieren und testen sollte, auf die Frage der Synthesekosten im Vergleich zum Wert des Experiments hinaus. Die Bestimmung von Kosten oder Wert ist jedoch an sich schon ein schwieriges Downside.
Beispielsweise könnte ein Experiment teure Materialien erfordern oder ein hohes Risiko des Scheiterns bergen. Auf der Wertseite könnte man überlegen, wie nützlich es wäre, die Eigenschaften dieses Moleküls zu kennen oder ob solche Vorhersagen mit einem hohen Maß an Unsicherheit verbunden sind.
Gleichzeitig nutzen Pharmaunternehmen zur Verbesserung der Effizienz zunehmend die Batch-Synthese. Anstatt Moleküle einzeln zu testen, verwenden sie Kombinationen chemischer Bausteine, um mehrere Kandidaten gleichzeitig zu testen. Dies bedeutet jedoch, dass für alle chemischen Reaktionen dieselben experimentellen Bedingungen erforderlich sein müssen. Dies macht die Schätzung von Kosten und Nutzen noch schwieriger.
SPARROW begegnet dieser Herausforderung, indem es die gemeinsamen Zwischenverbindungen berücksichtigt, die an der Synthese von Molekülen beteiligt sind, und diese Informationen in seine Kosten-Nutzen-Funktion einbezieht.
„Wenn Sie an dieses Optimierungsspiel beim Entwerfen einer Cost von Molekülen denken, hängen die Kosten für das Hinzufügen einer neuen Struktur von den Molekülen ab, die Sie bereits ausgewählt haben“, sagt Coley.
Der Rahmen berücksichtigt außerdem Faktoren wie die Kosten der Ausgangsmaterialien, die Anzahl der an jedem Syntheseweg beteiligten Reaktionen und die Wahrscheinlichkeit, dass diese Reaktionen beim ersten Versuch erfolgreich sind.
Um SPARROW zu nutzen, stellt ein Wissenschaftler eine Reihe von Molekülverbindungen bereit, die er testen möchte, und eine Definition der Eigenschaften, die er zu finden hofft.
Von dort aus sammelt SPARROW Informationen über die Moleküle und ihre Synthesewege und wägt dann den Wert jedes einzelnen Moleküls gegen die Kosten für die Synthese einer Reihe von Kandidaten ab. Es wählt automatisch die beste Teilmenge von Kandidaten aus, die die Kriterien des Benutzers erfüllen, und findet die kostengünstigsten Synthesewege für diese Verbindungen.
„Die gesamte Optimierung wird in einem Schritt durchgeführt, sodass alle konkurrierenden Ziele gleichzeitig erreicht werden können“, sagt Fromer.
Ein vielseitiger Rahmen
SPARROW ist einzigartig, weil es Molekülstrukturen integrieren kann, die von Menschenhand entworfen wurden, solche, die in virtuellen Katalogen existieren, oder noch nie dagewesene Moleküle, die von generativen KI-Modellen erfunden wurden.
„Wir haben all diese unterschiedlichen Ideenquellen. Ein Teil des Reizes von SPARROW besteht darin, dass man all diese Ideen auf eine Ebene bringen kann“, fügt Coley hinzu.
Die Forscher evaluierten SPARROW, indem sie es in drei Fallstudien anwendeten. Die Fallstudien basierten auf realen Problemen, mit denen Chemiker konfrontiert sind, und sollten SPARROWs Fähigkeit testen, kosteneffiziente Synthesepläne zu finden und dabei mit einer breiten Palette von Eingangsmolekülen zu arbeiten.
Sie fanden heraus, dass SPARROW die Grenzkosten der Batchsynthese effektiv erfasste und gängige Versuchsschritte und Zwischenchemikalien identifizierte. Darüber hinaus ließ sich das System auf Hunderte potenzieller Molekülkandidaten hochskalieren.
„In der Gemeinschaft des maschinellen Lernens für die Chemie gibt es so viele Modelle, die sich beispielsweise intestine für die Retrosynthese oder die Vorhersage molekularer Eigenschaften eignen, aber wie nutzen wir sie eigentlich? Unser Framework zielt darauf ab, den Wert dieser Vorarbeit hervorzuheben. Durch die Entwicklung von SPARROW können wir hoffentlich andere Forscher dazu anregen, über die Herabselektion von Verbindungen unter Verwendung ihrer eigenen Kosten- und Nutzenfunktionen nachzudenken“, sagt Fromer.
In Zukunft wollen die Forscher SPARROW noch komplexer gestalten. So möchten sie den Algorithmus beispielsweise so einrichten, dass er berücksichtigt, dass der Wert des Testens einer Verbindung nicht immer konstant sein muss. Außerdem möchten sie mehr Elemente der parallelen Chemie in die Kosten-Nutzen-Funktion einbeziehen.
„Die Arbeit von Fromer und Coley passt algorithmische Entscheidungsfindung besser an die praktischen Realitäten der chemischen Synthese an. Wenn vorhandene computergestützte Designalgorithmen verwendet werden, bleibt die Arbeit, herauszufinden, wie die Designsätze am besten synthetisiert werden können, dem Medizinalchemiker überlassen, was zu weniger optimalen Entscheidungen und Mehrarbeit für den Medizinalchemiker führt“, sagt Patrick Riley, Senior Vice President für künstliche Intelligenz bei Relay Therapeutics, der nicht an dieser Forschung beteiligt conflict. „Dieses Papier zeigt einen prinzipiellen Weg auf, um die Berücksichtigung der gemeinsamen Synthese einzubeziehen, was meiner Erwartung nach zu qualitativ hochwertigeren und akzeptierteren algorithmischen Designs führen wird.“
„Die Identifizierung der zu synthetisierenden Verbindungen unter sorgfältiger Berücksichtigung von Zeit, Kosten und Potenzial für Fortschritte bei der Zielerreichung und gleichzeitiger Bereitstellung nützlicher neuer Informationen ist eine der größten Herausforderungen für Arzneimittelforschungsteams. Der SPARROW-Ansatz von Fromer und Coley erledigt dies auf effektive und automatisierte Weise und bietet ein nützliches Werkzeug für Humanmedizinchemieteams und unternimmt wichtige Schritte in Richtung vollständig autonomer Ansätze zur Arzneimittelforschung“, fügt John Chodera hinzu, ein Computerchemiker am Memorial Sloan Kettering Most cancers Middle, der nicht an dieser Arbeit beteiligt conflict.
Diese Forschung wurde teilweise vom DARPA Accelerated Molecular Discovery Program, dem Workplace of Naval Analysis und der Nationwide Science Basis unterstützt.