Wenn Wasser gefriert, geht es von einer flüssigen Part in eine feste Part über, was zu einer drastischen Änderung von Eigenschaften wie Dichte und Volumen führt. Phasenübergänge in Wasser sind so häufig, dass die meisten von uns wahrscheinlich nicht einmal darüber nachdenken, aber Phasenübergänge in neuartigen Materialien oder komplexen physikalischen Systemen sind ein wichtiges Forschungsgebiet.
Um diese Systeme vollständig zu verstehen, müssen Wissenschaftler in der Lage sein, Phasen zu erkennen und die Übergänge zwischen ihnen zu erkennen. Doch wie man Phasenänderungen in einem unbekannten System quantifiziert, ist oft unklar, insbesondere wenn Daten knapp sind.
Forscher des MIT und der Universität Basel in der Schweiz wandten generative Modelle der künstlichen Intelligenz auf dieses Drawback an und entwickelten ein neues Framework für maschinelles Lernen, das automatisch Phasendiagramme für neuartige physikalische Systeme abbilden kann.
Ihr physikbasierter maschineller Lernansatz ist effizienter als mühsame, manuelle Techniken, die auf theoretischem Fachwissen beruhen. Wichtig ist, dass ihr Ansatz generative Modelle nutzt und daher keine großen, gekennzeichneten Trainingsdatensätze erfordert, die in anderen Techniken des maschinellen Lernens verwendet werden.
Ein solcher Rahmen könnte Wissenschaftlern beispielsweise dabei helfen, die thermodynamischen Eigenschaften neuartiger Materialien zu untersuchen oder Verschränkungen in Quantensystemen zu erkennen. Letztendlich könnte diese Technik es Wissenschaftlern ermöglichen, unbekannte Phasen der Materie autonom zu entdecken.
„Wenn Sie ein neues System mit völlig unbekannten Eigenschaften haben, wie würden Sie dann auswählen, welche beobachtbare Größe untersucht werden soll? Zumindest mit datengesteuerten Instruments besteht die Hoffnung, dass Sie große neue Systeme automatisiert scannen können, und dass Sie dadurch auf wichtige Änderungen im System hingewiesen werden. Dies könnte ein Werkzeug in der Pipeline der automatisierten wissenschaftlichen Entdeckung neuer, exotischer Eigenschaften von Phasen sein“, sagt Frank Schäfer, Postdoktorand im Julia Lab im Pc Science and Synthetic Intelligence Laboratory (CSAIL) und Co-Autor einer Arbeit zum Thema dieser Ansatz.
An der Arbeit von Schäfer beteiligten sich Erstautor Julian Arnold, ein Doktorand an der Universität Basel; Alan Edelman, Professor für angewandte Mathematik am Fachbereich Mathematik und Leiter des Julia Lab; und leitender Autor Christoph Bruder, Professor am Departement Physik der Universität Basel. Die Forschung ist heute veröffentlicht In Briefe zur körperlichen Untersuchung.
Phasenübergänge mithilfe von KI erkennen
Während der Übergang von Wasser zu Eis zu den offensichtlichsten Beispielen für einen Phasenwechsel gehört, sind auch exotischere Phasenwechsel, etwa der Übergang eines Supplies von einem normalen Leiter zu einem Supraleiter, für Wissenschaftler von großem Interesse.
Diese Übergänge können durch die Identifizierung eines „Ordnungsparameters“ erkannt werden, einer Größe, die wichtig ist und sich voraussichtlich ändern wird. Beispielsweise gefriert Wasser und geht in eine feste Part (Eis) über, wenn seine Temperatur unter 0 Grad Celsius fällt. In diesem Fall könnte ein geeigneter Ordnungsparameter anhand des Anteils der Wassermoleküle, die Teil des Kristallgitters sind, im Vergleich zu denen, die in einem ungeordneten Zustand verbleiben, definiert werden.
In der Vergangenheit haben sich Forscher bei der manuellen Erstellung von Phasendiagrammen auf physikalisches Fachwissen verlassen und dabei auf theoretisches Verständnis zurückgegriffen, um zu wissen, welche Ordnungsparameter wichtig sind. Dies ist nicht nur bei komplexen Systemen mühsam und bei unbekannten Systemen mit neuen Verhaltensweisen möglicherweise unmöglich, sondern führt auch zu einer menschlichen Voreingenommenheit bei der Lösung.
In jüngerer Zeit haben Forscher damit begonnen, maschinelles Lernen zu nutzen, um diskriminierende Klassifikatoren zu entwickeln, die diese Aufgabe lösen können, indem sie lernen, eine Messstatistik so zu klassifizieren, dass sie aus einer bestimmten Part des physikalischen Techniques stammt, auf die gleiche Weise, wie solche Modelle ein Bild als Katze oder Hund klassifizieren.
Die MIT-Forscher zeigten, wie generative Modelle verwendet werden können, um diese Klassifizierungsaufgabe viel effizienter und auf physikinformierte Weise zu lösen.
Der Julia-Programmierspracheeine beliebte Sprache für wissenschaftliches Rechnen, die auch in den Einführungskursen zur linearen Algebra des MIT verwendet wird, bietet viele Werkzeuge, die sie für die Konstruktion solcher generativen Modelle von unschätzbarem Wert machen, fügt Schäfer hinzu.
Generative Modelle, wie die, die ChatGPT und Dall-E zugrunde liegen, funktionieren typischerweise durch Schätzung der Wahrscheinlichkeitsverteilung einiger Daten, die sie verwenden, um neue Datenpunkte zu generieren, die zur Verteilung passen (z. B. neue Katzenbilder, die vorhandenen Katzenbildern ähneln). .
Wenn jedoch Simulationen eines physikalischen Techniques mit bewährten wissenschaftlichen Techniken verfügbar sind, erhalten Forscher kostenlos ein Modell seiner Wahrscheinlichkeitsverteilung. Diese Verteilung beschreibt die Messstatistik des physikalischen Techniques.
Ein sachkundigeres Modell
Die Erkenntnis des MIT-Groups ist, dass diese Wahrscheinlichkeitsverteilung auch ein generatives Modell definiert, auf dem ein Klassifikator aufgebaut werden kann. Sie fügen das generative Modell in statistische Standardformeln ein, um direkt einen Klassifikator zu konstruieren, anstatt ihn aus Stichproben zu lernen, wie dies bei diskriminierenden Ansätzen der Fall conflict.
„Dies ist eine wirklich gute Möglichkeit, etwas, das Sie über Ihr physisches System wissen, tief in Ihr maschinelles Lernschema zu integrieren. Es geht weit über die bloße Durchführung von Characteristic-Engineering an Ihren Datenproben oder einfachen induktiven Verzerrungen hinaus“, sagt Schäfer.
Dieser generative Klassifikator kann anhand bestimmter Parameter wie Temperatur oder Druck bestimmen, in welcher Part sich das System befindet. Und weil die Forscher die Wahrscheinlichkeitsverteilungen, die den Messungen zugrunde liegen, direkt aus dem physikalischen System approximieren, verfügt der Klassifikator über Systemkenntnisse.
Dadurch ist ihre Methode leistungsfähiger als andere Techniken des maschinellen Lernens. Und da es automatisch funktionieren kann, ohne dass umfangreiches Coaching erforderlich ist, steigert ihr Ansatz die Recheneffizienz bei der Identifizierung von Phasenübergängen erheblich.
Am Ende des Tages können die Forscher dem generativen Klassifikator Fragen stellen, ähnlich wie man ChatGPT bitten würde, ein mathematisches Drawback zu lösen, wie „Gehört diese Stichprobe zu Part I oder Part II?“ oder „Wurde diese Probe bei hoher oder niedriger Temperatur erzeugt?“
Wissenschaftler könnten diesen Ansatz auch nutzen, um verschiedene binäre Klassifizierungsaufgaben in physikalischen Systemen zu lösen, möglicherweise um Verschränkungen in Quantensystemen zu erkennen (ist der Zustand verschränkt oder nicht?) oder um festzustellen, ob Theorie A oder B am besten zur Lösung eines bestimmten Issues geeignet ist. Sie könnten diesen Ansatz auch nutzen, um große Sprachmodelle wie ChatGPT besser zu verstehen und zu verbessern, indem sie ermitteln, wie bestimmte Parameter optimiert werden sollten, damit der Chatbot die besten Ergebnisse liefert.
In Zukunft wollen die Forscher auch theoretische Garantien dafür untersuchen, wie viele Messungen sie benötigen würden, um Phasenübergänge effektiv zu erkennen, und den dafür erforderlichen Rechenaufwand abschätzen.
Diese Arbeit wurde teilweise vom Schweizerischen Nationalfonds, dem MIT-Switzerland Lockheed Martin Seed Fund und MIT Worldwide Science and Know-how Initiatives finanziert.