Die Mehrdeutigkeit in der medizinischen Bildgebung kann für Kliniker, die versuchen, Krankheiten zu identifizieren, große Herausforderungen darstellen. Zum Beispiel kann in einer Röntgenaufnahme des Brustkorbs, Pleuraerguss, eine abnormale Flüssigkeitsansammlung in der Lunge sehr ähnlich wie Lungeninfiltrate, bei denen Eiter oder Blutansammlungen sind.
Ein Modell für künstliche Intelligenz könnte den Kliniker bei der Röntgenanalyse helfen, indem sie subtile Particulars identifizieren und die Effizienz des Diagnoseprozesses steigern. Da in einem Bild so viele mögliche Erkrankungen vorhanden sein könnten, möchte der Kliniker wahrscheinlich eine Reihe von Möglichkeiten in Betracht ziehen, anstatt nur eine KI -Vorhersage zu bewerten.
Eine vielversprechende Möglichkeit, eine Reihe von Möglichkeiten zu erstellen, die als konforme Klassifizierung bezeichnet werden, ist bequem, da sie auf einem vorhandenen maschinellen Lernmodell leicht implementiert werden kann. Es kann jedoch unpraktisch große Sätze erzeugen.
MIT -Forscher haben jetzt eine einfache und effektive Verbesserung entwickelt, die die Größe der Vorhersagesätze um bis zu 30 Prozent verringern und gleichzeitig Vorhersagen zuverlässiger machen kann.
Ein kleinerer Vorhersagesatz kann einem Kliniker null helfen, die richtige Diagnose effizienter zu machen, was die Behandlung für Patienten verbessern und rationalisieren kann. Diese Methode könnte über eine Reihe von Klassifizierungsaufgaben nützlich sein – beispielsweise zur Identifizierung der Arten eines Tieres in einem Bild aus einem Wildpark -, da sie eine kleinere, aber genauere Reihe von Optionen bietet.
„Da weniger Klassen zu berücksichtigen sind, sind die Vorhersagen von Natur aus informativer, als Sie zwischen weniger Optionen wählen. In gewissem Sinne opfern Sie nichts in Bezug auf die Genauigkeit für etwas, das informativer ist“, sagt Divya Shanmugam PhD ’24, ein Postdoc bei Cornell Tech, der diese Forschung battle.
Shanmugam ist an der Papier von Helen Lu ’24; Swami Sankaranarayanan, ein ehemaliger MIT Postdoc, der heute Forschungswissenschaftler bei Lilia Biosciences ist; und Senior -Autor John Guttag, Professor für Informatik und Elektrotechnik von Dugald C. Jackson am MIT und Mitglied des MIT Informatik und der Künstlichen Intelligence Laboratory (CSAIL). Die Forschung wird auf der Konferenz über Pc Imaginative and prescient und Mustererkennung im Juni vorgestellt.
Vorhersagegarantien
AI-Assistenten, die für Aufgaben mit hohen Einsätzen eingesetzt werden, z. B. die Klassifizierung von Krankheiten in medizinischen Bildern, werden in der Regel zusammen mit jeder Vorhersage eine Wahrscheinlichkeitsbewertung erstellen, damit ein Benutzer das Vertrauen des Modells messen kann. Beispielsweise könnte ein Modell vorhersagen, dass ein Bild eine 20 -prozentige Wahrscheinlichkeit besteht, dass ein Bild einer bestimmten Diagnose wie Pleurisy entspricht.
Es ist jedoch schwierig, dem vorhergesagten Vertrauen eines Modells zu vertrauen, da viele frühere Untersuchungen gezeigt haben, dass diese Wahrscheinlichkeiten ungenau sein können. Bei der konformen Klassifizierung wird die Vorhersage des Modells durch einen Satz der wahrscheinlichsten Diagnosen ersetzt und garantiert, dass die korrekte Diagnose irgendwo im Satz liegt.
Die inhärente Unsicherheit in AI -Vorhersagen führt jedoch häufig dazu, dass das Modell viel zu groß sind, um nützlich zu sein.
Wenn beispielsweise ein Modell ein Tier in einem Bild als eine von 10.000 potenziellen Arten klassifiziert, kann es einen Satz von 200 Vorhersagen ausgeben, damit es eine starke Garantie bieten kann.
„Das sind einige Klassen, die jemand durchsuchen kann, um herauszufinden, was die richtige Klasse ist“, sagt Shanmugam.
Die Technik kann auch unzuverlässig sein, da winzige Änderungen an Eingängen wie leichtes Drehen eines Bildes völlig unterschiedliche Vorhersagensätze ergeben können.
Um die konforme Klassifizierung nützlicher zu machen, wendeten die Forscher eine Technik an, die entwickelt wurde, um die Genauigkeit von Pc-Imaginative and prescient-Modellen, die als Check-Time Augmentation (TTA) bezeichnet werden, zu verbessern.
TTA erstellt mehrere Augmentationen eines einzelnen Bildes in einem Datensatz, möglicherweise durch Kamm des Bildes, das Umdrehen, das Zoomen usw. Dann wendet es ein Pc -Imaginative and prescient -Modell auf jede Model desselben Bildes an und aggregiert seine Vorhersagen.
„Auf diese Weise erhalten Sie aus einem einzigen Beispiel mehrere Vorhersagen. Die Aggregation von Vorhersagen verbessert die Vorhersagen in Bezug auf Genauigkeit und Robustheit“, erklärt Shanmugam.
Genauigkeit maximieren
Um TTA anzuwenden, halten die Forscher einige markierte Bilddaten aus, die für den konformen Klassifizierungsprozess verwendet werden. Sie lernen, die Augmentationen zu diesen gehaltenen Daten zu aggregieren und die Bilder automatisch auf eine Weise zu erweitern, die die Genauigkeit der Vorhersagen des zugrunde liegenden Modells maximiert.
Dann führen sie die konforme Klassifizierung der neuen TTA-transformierten Vorhersagen des Modells durch. Der konforme Klassifizierer gibt einen kleineren Satz wahrscheinlicher Vorhersagen für die gleiche Vertrauensgarantie aus.
„Die Kombination der Testzeitvergrößerung mit konforme Vorhersage ist einfach zu implementieren, wirksam in der Praxis und erfordert keine Modellumschulung“, sagt Shanmugam.
Im Vergleich zu früheren Arbeiten in der konformen Vorhersage über mehrere Normal-Bildklassifizierungsbenchmarks wurden ihre TTA-AUGmented-Methoden die Größe der Vorhersagegrößen über die Experimente hinweg von 10 auf 30 Prozent reduziert.
Wichtig ist, dass die Technik diese Verringerung der Vorhersage -Set -Größe erreicht und gleichzeitig die Wahrscheinlichkeitsgarantie beibehalten.
Die Forscher stellten auch fest, dass, obwohl sie einige markierte Daten opfern, die normalerweise für das konforme Klassifizierungsverfahren verwendet werden, TTA die Genauigkeit steigert, um die Kosten für den Verlust dieser Daten zu überwiegen.
„Es wirft interessante Fragen auf, wie wir beschriftete Daten nach dem Modelltraining verwendet haben. Die Zuweisung von markierten Daten zwischen verschiedenen Schritten nach der Ausbildung ist eine wichtige Richtung für zukünftige Arbeiten“, sagt Shanmugam.
In Zukunft möchten die Forscher die Wirksamkeit eines solchen Ansatzes im Kontext von Modellen validieren, die Textual content anstelle von Bildern klassifizieren. Um die Arbeit weiter zu verbessern, überlegen die Forscher auch Möglichkeiten, die für TTA erforderliche Berechnung zu verringern.
Diese Forschung wird teilweise vom WISTROM CORPORATION finanziert.