Die Erstellung einer einzigartigen und vielversprechenden Forschungshypothese ist eine grundlegende Fähigkeit eines jeden Wissenschaftlers. Es kann auch zeitaufwändig sein: Neue Doktoranden verbringen möglicherweise das erste Jahr ihres Programms damit, genau zu entscheiden, was sie in ihren Experimenten untersuchen möchten. Was wäre, wenn künstliche Intelligenz helfen könnte?
MIT-Forscher haben eine Möglichkeit geschaffen, durch die Zusammenarbeit zwischen Mensch und KI autonom vielversprechende Forschungshypothesen bereichsübergreifend zu generieren und zu bewerten. In einem neuen Artikel beschreiben sie, wie sie diesen Rahmen nutzten, um evidenzbasierte Hypothesen zu erstellen, die mit ungedecktem Forschungsbedarf im Bereich biologisch inspirierter Materialien übereinstimmen.
Veröffentlicht am Mittwoch in Fortschrittliche MaterialienDie Studie wurde gemeinsam von Alireza Ghafarollahi, einem Postdoc am Laboratory for Atomistic and Molecular Mechanics (LAMM), und Markus Buehler, dem Jerry McAfee-Professor für Ingenieurwissenschaften in den MIT-Abteilungen für Bau- und Umweltingenieurwesen sowie für Maschinenbau und Direktor von, verfasst LAMM.
Das Framework, das die Forscher SciAgents nennen, besteht aus mehreren KI-Agenten, jeder mit spezifischen Fähigkeiten und Zugriff auf Daten, die „Graph Reasoning“-Methoden nutzen, bei denen KI-Modelle einen Wissensgraphen nutzen, der Beziehungen zwischen verschiedenen wissenschaftlichen Konzepten organisiert und definiert. Der Multi-Agenten-Ansatz ahmt die Artwork und Weise nach, wie sich biologische Systeme als Gruppen elementarer Bausteine organisieren. Buehler weist darauf hin, dass dieses „Teile und herrsche“-Prinzip ein herausragendes Paradigma in der Biologie auf vielen Ebenen ist, von Materialien über Insektenschwärme bis hin zu Zivilisationen – alles Beispiele, bei denen die Gesamtintelligenz viel größer ist als die Summe der Fähigkeiten einzelner Personen.
„Durch den Einsatz mehrerer KI-Agenten versuchen wir, den Prozess zu simulieren, durch den Wissenschaftlergemeinschaften Entdeckungen machen“, sagt Buehler. „Am MIT erreichen wir das, indem wir eine Gruppe von Menschen mit unterschiedlichem Hintergrund zusammenarbeiten lassen und einander in Cafés oder im Infinite Hall des MIT begegnen. Aber das ist sehr zufällig und langsam. Unser Ziel ist es, den Entdeckungsprozess zu simulieren, indem wir untersuchen, ob KI-Systeme kreativ sein und Entdeckungen machen können.“
Gute Ideen automatisieren
Wie jüngste Entwicklungen gezeigt haben, haben große Sprachmodelle (LLMs) eine beeindruckende Fähigkeit gezeigt, Fragen zu beantworten, Informationen zusammenzufassen und einfache Aufgaben auszuführen. Sie sind jedoch recht begrenzt, wenn es darum geht, neue Ideen von Grund auf zu generieren. Die MIT-Forscher wollten ein System entwerfen, das es KI-Modellen ermöglicht, einen anspruchsvolleren, mehrstufigen Prozess durchzuführen, der über das Abrufen von während des Trainings gelernten Informationen hinausgeht, um neues Wissen zu extrapolieren und zu schaffen.
Die Grundlage ihres Ansatzes ist ein ontologischer Wissensgraph, der verschiedene wissenschaftliche Konzepte organisiert und Verbindungen zwischen ihnen herstellt. Um die Diagramme zu erstellen, geben die Forscher eine Reihe wissenschaftlicher Arbeiten in ein generatives KI-Modell ein. In bisherige ArbeitBuehler nutzte ein als Kategorietheorie bekanntes Mathematikgebiet, um dem KI-Modell dabei zu helfen, Abstraktionen wissenschaftlicher Konzepte als Graphen zu entwickeln, die auf der Definition von Beziehungen zwischen Komponenten basieren, und zwar auf eine Weise, die von anderen Modellen durch einen Prozess namens Graph Reasoning analysiert werden konnte. Dies konzentriert KI-Modelle auf die Entwicklung einer prinzipielleren Methode zum Verständnis von Konzepten. Es ermöglicht ihnen auch, domänenübergreifend besser zu verallgemeinern.
„Das ist für uns wirklich wichtig, um wissenschaftsorientierte KI-Modelle zu erstellen, da wissenschaftliche Theorien typischerweise auf verallgemeinerbaren Prinzipien basieren und nicht nur auf dem Abruf von Wissen“, sagt Buehler. „Indem wir KI-Modelle auf diese Weise auf ‚Denken‘ konzentrieren, können wir über herkömmliche Methoden hinausgehen und kreativere Einsatzmöglichkeiten von KI erkunden.“
Für die jüngste Arbeit verwendeten die Forscher etwa 1.000 wissenschaftliche Studien zu biologischen Materialien, aber Buehler sagt, dass die Wissensgraphen mit weit mehr oder weniger Forschungsarbeiten aus jedem Bereich erstellt werden könnten.
Mit der Erstellung des Diagramms entwickelten die Forscher ein KI-System für wissenschaftliche Entdeckungen, mit mehreren Modellen, die darauf spezialisiert sind, bestimmte Rollen im System zu spielen. Die meisten Komponenten basieren auf den Modellen der ChatGPT-4-Serie von OpenAI und nutzen eine als In-Context-Studying bekannte Technik, bei der Eingabeaufforderungen kontextbezogene Informationen über die Rolle des Modells im System bereitstellen und es ihm gleichzeitig ermöglichen, aus den bereitgestellten Daten zu lernen.
Die einzelnen Agenten im Framework interagieren miteinander, um gemeinsam ein komplexes Downside zu lösen, das keiner von ihnen alleine lösen könnte. Die erste Aufgabe besteht darin, die Forschungshypothese zu erstellen. Die LLM-Interaktionen beginnen, nachdem ein Untergraph aus dem Wissensgraphen definiert wurde. Dies kann zufällig oder durch manuelle Eingabe eines in den Artikeln besprochenen Schlüsselwortpaars erfolgen.
In diesem Rahmen hat ein Sprachmodell, das die Forscher „Ontologe“ nennen, die Aufgabe, wissenschaftliche Begriffe in den Arbeiten zu definieren, die Verbindungen zwischen ihnen zu untersuchen und so den Wissensgraphen zu konkretisieren. Ein Modell mit dem Namen „Wissenschaftler 1“ erstellt dann einen Forschungsvorschlag basierend auf Faktoren wie seiner Fähigkeit, unerwartete Eigenschaften und Neuheiten aufzudecken. Der Vorschlag umfasst eine Diskussion möglicher Ergebnisse, die Auswirkungen der Forschung und eine Vermutung über die zugrunde liegenden Wirkmechanismen. Ein „Scientist 2“-Modell erweitert die Idee, indem es spezifische experimentelle und Simulationsansätze vorschlägt und weitere Verbesserungen vornimmt. Abschließend beleuchtet ein „kritisches“ Modell seine Stärken und Schwächen und schlägt weitere Verbesserungen vor.
„Es geht darum, ein Workforce von Experten aufzubauen, die nicht alle gleich denken“, sagt Buehler. „Sie müssen anders denken und unterschiedliche Fähigkeiten haben. Der Critic-Agent ist bewusst darauf programmiert, die anderen zu kritisieren, sodass nicht alle zustimmen und sagen, dass es eine großartige Idee ist. Ein Agent sagt: „Hier liegt eine Schwäche, können Sie das besser erklären?“ Dadurch unterscheidet sich die Ausgabe erheblich von Einzelmodellen.“
Andere Agenten im System können vorhandene Literatur durchsuchen, wodurch das System nicht nur die Möglichkeit hat, die Machbarkeit zu bewerten, sondern auch die Neuheit jeder Idee zu entwickeln und zu bewerten.
Das System stärken
Um ihren Ansatz zu validieren, erstellten Buehler und Ghafarollahi einen Wissensgraphen, der auf den Wörtern „Seide“ und „energieintensiv“ basiert. Unter Verwendung des Frameworks schlug das „Scientist 1“-Modell vor, Seide mit Pigmenten auf Löwenzahnbasis zu integrieren, um Biomaterialien mit verbesserten optischen und mechanischen Eigenschaften zu schaffen. Das Modell prognostizierte, dass das Materials deutlich stärker sein würde als herkömmliche Seidenmaterialien und weniger Energie für die Verarbeitung erfordern würde.
Anschließend machte Wissenschaftler 2 Vorschläge, etwa die Verwendung spezieller molekulardynamischer Simulationswerkzeuge, um zu untersuchen, wie die vorgeschlagenen Materialien interagieren würden, und fügte hinzu, dass eine gute Anwendung für das Materials ein bioinspirierter Klebstoff wäre. Das Critic-Modell hob dann mehrere Stärken des vorgeschlagenen Supplies und verbesserungswürdige Bereiche hervor, wie z. B. seine Skalierbarkeit, Langzeitstabilität und die Umweltauswirkungen der Verwendung von Lösungsmitteln. Um diese Bedenken auszuräumen, schlug der Kritiker die Durchführung von Pilotstudien zur Prozessvalidierung und die Durchführung strenger Analysen der Materialhaltbarkeit vor.
Die Forscher führten auch andere Experimente mit zufällig ausgewählten Schlüsselwörtern durch, die verschiedene originelle Hypothesen über effizientere biomimetische Mikrofluidikchips, die Verbesserung der mechanischen Eigenschaften von Gerüsten auf Kollagenbasis und die Wechselwirkung zwischen Graphen und Amyloidfibrillen zur Herstellung bioelektronischer Geräte hervorbrachten.
„Das System conflict in der Lage, diese neuen, schlüssigen Ideen basierend auf dem Pfad des Wissensgraphen zu entwickeln“, sagt Ghafarollahi. „In Bezug auf Neuheit und Anwendbarkeit wirkten die Materialien sturdy und neuartig. In der zukünftigen Arbeit werden wir Tausende oder Zehntausende neuer Forschungsideen generieren, und dann können wir sie kategorisieren und versuchen, besser zu verstehen, wie diese Materialien erzeugt werden und wie sie weiter verbessert werden könnten.“
Die Forscher hoffen, in Zukunft neue Instruments zum Abrufen von Informationen und zum Ausführen von Simulationen in ihre Frameworks integrieren zu können. Sie können die Basismodelle in ihren Frameworks auch problemlos gegen fortgeschrittenere Modelle austauschen, sodass sich das System an die neuesten Innovationen in der KI anpassen kann.
„Aufgrund der Artwork und Weise, wie diese Agenten interagieren, hat eine Verbesserung in einem Modell, selbst wenn sie geringfügig ist, große Auswirkungen auf das Gesamtverhalten und die Leistung des Techniques“, sagt Buehler.
Seit der Veröffentlichung eines Preprints mit Open-Supply-Particulars ihres Ansatzes wurden die Forscher von Hunderten von Menschen kontaktiert, die daran interessiert waren, die Frameworks in verschiedenen wissenschaftlichen Bereichen und sogar in Bereichen wie Finanzen und Cybersicherheit einzusetzen.
„Es gibt eine Menge Dinge, die man tun kann, ohne ins Labor gehen zu müssen“, sagt Buehler. „Grundsätzlich möchte man ganz am Ende des Prozesses ins Labor gehen. Das Labor ist teuer und nimmt viel Zeit in Anspruch. Daher benötigen Sie ein System, das tief in die besten Ideen eindringen, die besten Hypothesen formulieren und aufkommendes Verhalten genau vorhersagen kann. Unsere Imaginative and prescient ist es, dies benutzerfreundlich zu gestalten, sodass Sie eine App verwenden können, um andere Ideen einzubringen oder Datensätze einzufügen, um das Modell wirklich herauszufordern und neue Entdeckungen zu machen.“