1. Einführung: Warum Graustufenbilder die Anomalie -Erkennung beeinflussen können.
  2. Anomalieerkennung, Graustufenbilder: Schnelle Zusammenfassung der beiden in diesem Artikel diskutierten Hauptfächer.
  3. Experimentierung: Was und wie vergleichen wir.
  4. Leistungsergebnisse: Wie Graustufenbilder die Modellleistung beeinflussen.
  5. Geschwindigkeitsergebnisse: Wie Graustufenbilder die Inferenzgeschwindigkeit beeinflussen.
  6. Abschluss

1. Einführung

In diesem Artikel werden wir untersuchen, wie Graustufenbilder die Leistung von Anomalie -Erkennungsmodellen beeinflussen und untersuchen, wie diese Wahl die Inferenzgeschwindigkeit beeinflusst.

In Laptop Imaginative and prescient ist intestine bekannt, dass feine vorgebildete Klassifizierungsmodelle auf Graustufenbildern fein abgestimmte können führen zu einer erneuten Leistung. Aber was ist mit Anomalie -Erkennungsmodelle? Diese Modelle erfordern keine Feinabstimmung, verwenden jedoch vorgeborene Klassifizierungsmodelle wie Burderesnet oder EfficientNET als Function-Extraktoren. Dies wirft eine wichtige Frage auf: Haben diese Merkmalextraktoren weniger relevante Merkmale, wenn sie auf ein Graustufenbild angewendet werden?

Bild aus dem aufgenommen Visa -Datensatz (Cc-by-4.0) und verarbeitet verwendet Anomalib -Bibliothek

Diese Frage ist nicht nur akademisch, sondern eine mit realen Auswirkungen auf alle, die an der Automatisierung der industriellen visuellen Inspektion in der Fertigung arbeiten. Zum Beispiel fragen Sie sich möglicherweise, ob eine Farbkamera erforderlich ist oder ob eine billigere Graustufe ausreicht. Oder Sie könnten Bedenken hinsichtlich der Inferenzgeschwindigkeit haben und die Möglichkeit nutzen möchten, sie zu erhöhen.

2. Anomalie -Detektion, Graustufenbilder

Wenn Sie sowohl mit der Anomalie -Erkennung in Laptop Imaginative and prescient als auch mit den Grundlagen der digitalen Bilddarstellung vertraut sind, können Sie diesen Abschnitt gerne überspringen. Andernfalls bietet es einen kurzen Überblick und Hyperlinks zur weiteren Erkundung.

Anomalieerkennung

Im Laptop Imaginative and prescient ist die Erkennung von Anomalie ein sich schnell entwickeltes Feld im Deep-Lernen, das sich auf die Identifizierung ungewöhnlicher Muster in Bildern konzentriert. Typischerweise werden diese Modelle nur mit Bildern ohne Defekte trainiert, sodass das Modell lernen kann, wie „regular“ aussieht. Während der Inferenz kann das Modell Bilder erkennen, die von dieser gelernten Darstellung als irregular abweichen. Solche Anomalien entsprechen oft verschiedenen Mängel, die in einer Produktionsumgebung auftreten können, aber während des Trainings nicht gesehen wurden. Eine detailliertere Einführung finden Sie unter Dieser Hyperlink.

Graustufenbilder

Für Menschen sehen Farb- und Graustufenbilder ziemlich ähnlich (abgesehen von der mangelnden Farbe). Für Laptop ist ein Bild jedoch eine Reihe von Zahlen, sodass es ein bisschen komplizierter wird. Ein Graustufenbild ist eine zweidimensionale Reihe von Zahlen, die typischerweise zwischen 0 und 255 liegen, wobei jeder Wert die Intensität eines Pixels darstellt, wobei 0 schwarz und 255 weiß ist.

Im Gegensatz dazu bestehen Farbbilder typischerweise aus drei solchen separaten Graustufenbildern (als Kanäle genannte) zusammengestapelt, um ein dreidimensionales Array zu bilden. Jeder Kanal (rot, grün und blau) beschreibt die Intensität der jeweiligen Farbe, und ihre Kombination erzeugt ein Farbbild. Sie können mehr darüber erfahren Hier.

3. Experimentierung

Modelle

Wir werden vier verwenden Stand der Technik Anomalie -Erkennungsmodelle: PatchcoreAnwesend RückwärtsdestillationAnwesend FastflowUnd GLAS. Diese Modelle repräsentieren verschiedene Arten von Anomalie -Erkennungsalgorithmen und werden gleichzeitig in praktischen Anwendungen aufgrund schneller Trainings- und Inferenzgeschwindigkeit häufig verwendet. Die ersten drei Modelle verwenden die Implementierung aus dem Anomalib -Bibliothekfür Glas beschäftigen wir die offizielle Umsetzung.

Bild des Autors

Datensatz

Für unsere Experimente verwenden wir die Visum Datensatz mit 12 Kategorien von Objekten, die eine Vielzahl von Bildern liefert und keine farbabhängigen Defekte aufweist.

Bild von Die Visa -Datensatz (Cc-by-4.0)

Metriken

Wir werden Bildniveau verwenden Auroc Um festzustellen, ob das gesamte Bild korrekt klassifiziert wurde, ohne eine bestimmte Schwelle auszuwählen, und Pixel-Ebene Auprowas zeigt, wie intestine wir in der Lokalisierung defekter Bereiche im Bild lokalisieren. Die Geschwindigkeit wird unter Verwendung der Metrik von Frames-Per Second (FPS) bewertet. Bei allen Metriken entsprechen höhere Werte besseren Ergebnissen.

Graustufenumwandlung

Um einen Bildgräustaste zu erstellen, werden wir verwenden Torchvision transformiert.

Bild des Autors

Für einen Kanal ändern wir auch Function -Extraktoren mit dem in_chans Parameter in der Timm -Bibliothek.

Bild des Autors

Der Code zur Anpassung von Anomalib an einen Kanal ist verfügbar Hier.

4. Leistungsergebnisse

RGB

Dies sind reguläre Bilder mit roten, blauen und grünen Kanälen.

Bild des Autors

Graustufen, drei Kanäle

Die Bilder wurden unter Verwendung von Torchvision -Transformation in Graustufen konvertiert Graustufen mit drei Kanälen.

Bild des Autors

Graustufen, ein Kanal

Die Bilder wurden unter Verwendung derselben Torchvision -Transformation mit einem Kanal in Graustufen konvertiert.

Bild des Autors

Vergleich

Wir können das sehen Patchcore Und Rückwärtsdestillation haben enge Ergebnisse in allen drei Experimenten sowohl für Metriken auf Bild- als auch für Pixelebene. Fastflow wird etwas schlimmer, und GLAS wird merklich schlechter. Die Ergebnisse werden in den 12 Kategorien von Objekten im Visa -Datensatz gemittelt.

Was ist mit Ergebnissen professional Kategorie von Objekten? Vielleicht funktionieren einige von ihnen schlechter als andere, und einige besser, was die durchschnittlichen Ergebnisse gleich aussehen? Hier ist die Visualisierung von Ergebnissen für PatchCore über alle drei Experimente hinweg, die zeigen, dass die Ergebnisse auch in Kategorien ziemlich stabil sind.

Bild des Autors

Die gleiche Visualisierung für Glas zeigt, dass einige Kategorien etwas besser sein können, während einige stark schlechter sein können. Dies wird jedoch nicht unbedingt nur durch Graustufentransformation verursacht. Einige davon können regelmäßige Ergebnisschwankungen aufgrund der Ausbildung des Modells sein. Durchschnittliche Ergebnisse zeigen eine klare Tendenz, dass RGB -Bilder für dieses Modell das beste Ergebnis, Graustufen mit drei Kanälen etwas schlechter und Graustufen mit einem Kanal das schlechteste Ergebnis erzielen.

Bild des Autors

Bonus

Wie ändern sich die Ergebnisse professional Kategorie? Es ist möglich, dass einige Kategorien einfach besser für RGB- oder Graustufenbilder geeignet sind, auch wenn es keine farbabhängigen Defekte gibt.

Hier ist die Visualisierung des Unterschieds zwischen RGB und Graustufen mit einem Kanal für alle Modelle. Wir können sehen, dass nur die Kategorie Pipe_Fryum für jedes Modell leicht (oder stark) schlechter wird. Der Relaxation der Kategorien wird je nach Modell schlechter oder besser.

Bild des Autors

Zusätzlicher Bonus

Wenn Sie daran interessiert sind, wie dieses Pipe_Fryum aussieht, finden Sie hier einige Beispiele mit Glasmodellvorhersagen.

Bilder von Die Visa -Datensatz (Cc-by-4.0) und verarbeitet mit GLAS Und Anomalib -Bibliothek

5. Geschwindigkeitsergebnisse

Die Anzahl der Kanäle betrifft nur die erste Schicht des Modells, der Relaxation bleibt unverändert. Die Geschwindigkeitsverbesserung scheint vernachlässigbar zu sein und zeigt, wie die Extraktion der ersten Schicht -Merkmals nur ein kleiner Teil der von den Modellen durchgeführten Berechnungen ist. Glas zeigt eine etwas auffällige Verbesserung, aber gleichzeitig zeigt es den schlimmsten Metriken.

Bild des Autors

6. Schlussfolgerung

Wie wirkt sich die Verwendung von Graustufenbildern auf die Erkennung der visuellen Anomalie aus? Es kommt darauf an, aber RGB scheint die sicherere Wette zu sein. Der Einfluss variiert je nach Modell und Daten. PatchCore und Reverse Destillation verarbeiten im Allgemeinen Graustufeneingänge intestine, aber Sie müssen mit Fastflow und insbesondere Glas vorsichtiger sein, was eine gewisse Geschwindigkeitsverbesserung, aber auch den bedeutendsten Rückgang der Leistungsmetriken zeigt. Wenn Sie die Greyscale -Eingabe verwenden möchten, müssen Sie diese mit RGB auf Ihren spezifischen Daten testen und vergleichen.

Das Jupyter -Notizbuch mit dem Anomalib -Code: Hyperlink.

Folgen Sie dem Autor LinkedIn Weitere Informationen zur Erkennung der industriellen visuellen Anomalie.

Referenzen

1. C. Hughes, Übertragungslernen auf graustufenen Bildern: Wie man vorbereitete Modelle fein abtun (2022), in RichtungDatascience.com

2. S. wehkamp, Ein praktischer Leitfaden zur bildbasierten Anomalie-Erkennung unter Verwendung von Anomalib (2022), weblog.ml6.eu

3. A. Baitieva, Y. Bouaouni, A. Briot, D. Amling, S. Khalfaoui und S. Akcay. Über akademische Benchmarks hinaus: Kritische Analyse und Greatest Practices für die Erkennung visueller Industrieanomalie (2025), CVPR -Workshop zur visuellen Anomalie und Neuheitserkennung (VAND)

4. Y. Zou, J. Jeong, L. Pemula, D. Zhang und O. Dabeeer, SPOT-THE-DIFFLENZ selbst überprüftes Vorbild für die Erkennung und Segmentierung von Anomalie (2022), ECCV

5. S. Akcay, D. Amling, A. Vaidya, B. Lakshmanan, N. Ahuja und U. Genc. Anomalib (2022), icip

Von admin

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert