Seit mehr als 100 Jahren nutzen Wissenschaftler die Röntgenkristallographie, um die Struktur kristalliner Materialien wie Metalle, Gestein und Keramik zu bestimmen.
Diese Technik funktioniert am besten, wenn der Kristall intakt ist. In vielen Fällen verfügen die Wissenschaftler jedoch nur über eine Pulverversion des Supplies, die zufällige Fragmente des Kristalls enthält. Dies macht es schwieriger, die Gesamtstruktur zusammenzusetzen.
Chemiker des MIT haben nun ein neues generatives KI-Modell entwickelt, mit dem sich die Struktur dieser Pulverkristalle wesentlich einfacher bestimmen lässt. Das Vorhersagemodell könnte Forschern dabei helfen, Materialien für den Einsatz in Batterien, Magneten und vielen anderen Anwendungen zu charakterisieren.
„Die Struktur ist das Erste, was man bei jedem Materials wissen muss. Sie ist wichtig für Supraleitung, sie ist wichtig für Magnete, sie ist wichtig, um zu wissen, welche Photovoltaik man erzeugt. Sie ist wichtig für jede denkbare Anwendung, die sich auf Materialien bezieht“, sagt Danna Freedman, Frederick George Keyes Professorin für Chemie am MIT.
Freedman und Jure Leskovec, Professor für Informatik an der Stanford College, sind die Hauptautoren der neuen Studie, die erscheint heute in der Zeitschrift der American Chemical SocietyDer MIT-Scholar Eric Riesel und der Scholar der Yale College Tsach Mackey sind die Hauptautoren des Artikels.
Markante Muster
Kristalline Materialien, zu denen Metalle und die meisten anderen anorganischen Feststoffe gehören, bestehen aus Gittern, die aus vielen identischen, sich wiederholenden Einheiten bestehen. Man kann sich diese Einheiten als „Boxen“ mit einer bestimmten Type und Größe vorstellen, in denen die Atome präzise angeordnet sind.
Wenn Röntgenstrahlen auf diese Gitter gerichtet werden, werden sie von Atomen mit unterschiedlichen Winkeln und Intensitäten gebeugt und geben so Informationen über die Positionen der Atome und die Bindungen zwischen ihnen preis. Seit Anfang des 20. Jahrhunderts wird diese Technik zur Analyse von Materialien eingesetzt, darunter auch biologische Moleküle mit kristalliner Struktur wie DNA und einige Proteine.
Bei Materialien, die nur als Kristallpulver vorliegen, wird das Lösen dieser Strukturen viel schwieriger, da die Fragmente nicht die vollständige 3D-Struktur des ursprünglichen Kristalls aufweisen.
„Das genaue Gitter existiert immer noch, denn was wir Pulver nennen, ist eigentlich eine Ansammlung von Mikrokristallen. Sie haben additionally das gleiche Gitter wie ein großer Kristall, aber die Orientierung ist völlig zufällig“, sagt Freedman.
Für Tausende dieser Materialien existieren Röntgenbeugungsmuster, die jedoch noch nicht entschlüsselt sind. Um die Strukturen dieser Materialien zu entschlüsseln, trainierten Freedman und ihre Kollegen ein maschinelles Lernmodell anhand von Daten aus einer Datenbank namens Supplies Challenge, die mehr als 150.000 Materialien enthält. Zunächst speisten sie Zehntausende dieser Materialien in ein bestehendes Modell ein, das simulieren kann, wie die Röntgenbeugungsmuster aussehen würden. Anschließend trainierten sie mit diesen Mustern ihr KI-Modell, das sie Crystalyze nennen, um Strukturen auf der Grundlage der Röntgenmuster vorherzusagen.
Das Modell unterteilt den Prozess der Strukturvorhersage in mehrere Teilaufgaben. Zunächst bestimmt es die Größe und Type der Gitterbox und welche Atome in sie hineinpassen. Dann sagt es die Anordnung der Atome innerhalb der Field voraus. Für jedes Beugungsmuster generiert das Modell mehrere mögliche Strukturen, die getestet werden können, indem die Strukturen in ein Modell eingespeist werden, das Beugungsmuster für eine gegebene Struktur bestimmt.
„Unser Modell ist eine generative KI, das heißt, es generiert etwas, das es noch nie zuvor gesehen hat, und das ermöglicht uns, mehrere verschiedene Vermutungen anzustellen“, sagt Riesel. „Wir können hundert Vermutungen anstellen und dann vorhersagen, wie das Pulvermuster für unsere Vermutungen aussehen sollte. Und wenn die Eingabe dann genauso aussieht wie die Ausgabe, wissen wir, dass wir richtig lagen.“
Unbekannte Strukturen lösen
Die Forscher testeten das Modell an mehreren tausend simulierten Beugungsmustern aus dem Supplies Challenge. Sie testeten es auch an mehr als 100 experimentellen Beugungsmustern aus der RRUFF-Datenbank, die pulverisierte Röntgenbeugungsdaten für quick 14.000 natürliche kristalline Mineralien enthält, die sie aus den Trainingsdaten herausgehalten hatten. Bei diesen Daten warfare das Modell in etwa 67 Prozent der Fälle genau. Dann begannen sie, das Modell an Beugungsmustern zu testen, die zuvor noch nicht gelöst worden waren. Diese Daten stammten aus der Powder Diffraction File, die Beugungsdaten für mehr als 400.000 gelöste und ungelöste Materialien enthält.
Mithilfe ihres Modells konnten die Forscher Strukturen für mehr als 100 dieser bisher ungelösten Muster finden. Außerdem nutzten sie ihr Modell, um Strukturen für drei Materialien zu entdecken, die Freedmans Labor erzeugte, indem es Elemente, die bei atmosphärischem Druck nicht reagieren, zwang, unter hohem Druck Verbindungen zu bilden. Mit diesem Ansatz lassen sich neue Materialien erzeugen, die trotz gleicher chemischer Zusammensetzung radikal unterschiedliche Kristallstrukturen und physikalische Eigenschaften aufweisen.
Beispiele für solche Materialien sind Graphit und Diamant – beide aus reinem Kohlenstoff. Die von Freedman entwickelten Materialien, die jeweils Wismut und ein weiteres Factor enthalten, könnten bei der Entwicklung neuer Materialien für Permanentmagnete von Nutzen sein.
„Wir haben in vorhandenen Daten viele neue Materialien gefunden und, was am wichtigsten ist, drei unbekannte Strukturen aus unserem Labor gelöst, die die ersten neuen binären Phasen dieser Elementkombinationen bilden“, sagt Freedman.
Die Fähigkeit, die Strukturen von pulverförmigen kristallinen Materialien zu bestimmen, könnte Forschern in nahezu allen materialbezogenen Bereichen helfen, so das MIT-Staff, das eine Weboberfläche für das Modell unter www.crystalyze.org.
Die Forschung wurde vom US-Energieministerium und der Nationwide Science Basis finanziert.