Black Forest Labs veröffentlicht FLUX.2 (klein), eine kompakte Bildmodellfamilie, die auf interaktive visuelle Intelligenz auf Verbraucherhardware abzielt. FLUX.2 (klein) erweitert die FLUX.2-Reihe um Era und Bearbeitung in weniger als einer Sekunde, eine einheitliche Architektur für Textual content zu Bild und Bild zu Bild sowie Bereitstellungsoptionen, die von lokalen GPUs bis hin zu Cloud-APIs reichen, während die Bildqualität auf dem neuesten Stand der Technik bleibt.
Von FLUX.2 (dev) bis zur interaktiven visuellen Intelligenz
FLUX.2 (dev) ist ein gleichgerichteter Flusstransformator mit 32 Milliarden Parametern für die textkonditionierte Bildgenerierung und -bearbeitung, einschließlich der Komposition mit mehreren Referenzbildern, und läuft hauptsächlich auf Beschleunigern der Rechenzentrumsklasse. Es ist auf maximale Qualität und Flexibilität ausgelegt, mit langen Sampling-Zeitplänen und hohen VRAM-Anforderungen.
FLUX.2 (klein) nimmt die gleiche Designrichtung auf und komprimiert sie in kleinere Gleichrichtertransformatoren mit 4 Milliarden und 9 Milliarden Parametern. Diese Modelle sind auf sehr kurze Sampling-Zeitpläne destilliert, unterstützen die gleichen Textual content-zu-Bild- und Multi-Referenz-Bearbeitungsaufgaben und sind für Reaktionszeiten unter 1 Sekunde auf modernen GPUs optimiert.
Modellfamilie und Fähigkeiten
Die FLUX.2 (klein)-Familie besteht aus 4 Hauptvarianten mit offenem Gewicht in einer einzigen Architektur.
- FLUX.2 (klein) 4B
- FLUX.2 (klein) 9B
- FLUX.2 (klein) 4B Foundation
- FLUX.2 (klein) 9B Foundation
FLUX.2 (klein) 4B und 9B sind stufendestillierte und führungsdestillierte Modelle. Sie nutzen 4 Inferenzschritte und gelten als die schnellsten Optionen für Produktions- und interaktive Workloads. FLUX.2 (klein) 9B kombiniert ein 9B-Flussmodell mit einem 8B-Qwen3-Texteinbetter und wird als das Flaggschiff-Kleinmodell an der Pareto-Grenze für Qualität versus Latenz zwischen Textual content und Bild, Einzelreferenzbearbeitung und Mehrfachreferenzgenerierung beschrieben.
Bei den Basisvarianten handelt es sich um undestillierte Versionen mit längeren Probenahmeplänen. In der Dokumentation werden sie als Basismodelle aufgeführt, die das vollständige Trainingssignal bewahren und eine höhere Ausgabevielfalt bieten. Sie sind für die Feinabstimmung, LoRA-Coaching, Forschungspipelines und benutzerdefinierte Submit-Coaching-Workflows gedacht, bei denen Kontrolle wichtiger ist als minimale Latenz.
Alle FLUX.2 (klein)-Modelle unterstützen drei Kernaufgaben in derselben Architektur. Sie können Bilder aus Textual content generieren, sie können ein einzelnes Eingabebild bearbeiten und sie können die Generierung und Bearbeitung mehrerer Referenzen durchführen, wobei mehrere Eingabebilder und eine Eingabeaufforderung gemeinsam die Zielausgabe definieren.
Latenz, VRAM und quantisierte Varianten
Die FLUX.2 (klein)-Modellseite bietet ungefähre Finish-to-Finish-Inferenzzeiten für GB200 und RTX 5090. FLUX.2 (klein) 4B ist die schnellste Variante und wird je nach {Hardware} mit etwa 0,3 bis 1,2 Sekunden professional Bild angegeben. FLUX.2 (klein) 9B strebt bei höherer Qualität etwa 0,5 bis 2 Sekunden an. Die Basismodelle benötigen mehrere Sekunden, da sie mit 50-stufigen Stichprobenplänen ausgeführt werden, bieten jedoch mehr Flexibilität für benutzerdefinierte Pipelines.
Die FLUX.2 (klein) 4B-Modellkarte gibt an, dass 4B in etwa 13 GB VRAM passt und für GPUs wie RTX 3090 und RTX 4070 geeignet ist. Die FLUX.2 (klein) 9B-Karte meldet einen Bedarf von etwa 29 GB VRAM und zielt auf {Hardware} wie die RTX 4090 ab. Dies bedeutet, dass eine einzige Excessive-Finish-Shopper-Karte die destillierten Varianten mit Sampling in voller Auflösung hosten kann.
Um die Reichweite auf mehr Geräte auszudehnen, veröffentlicht Black Forest Labs außerdem FP8- und NVFP4-Versionen für alle FLUX.2 (klein)-Varianten, die gemeinsam mit NVIDIA entwickelt wurden. Die FP8-Quantisierung wird als bis zu 1,6-mal schneller bei bis zu 40 Prozent geringerer VRAM-Nutzung beschrieben, und NVFP4 als bis zu 2,7-mal schneller bei bis zu 55 Prozent geringerer VRAM-Nutzung auf RTX-GPUs, bei gleichbleibenden Kernfunktionen.
Benchmarks mit anderen Bildmodellen
Black Forest Labs bewertet FLUX.2 (klein) anhand von Elo-Stilvergleichen in Bezug auf Textual content und Bild, Bearbeitung einzelner Referenzen und Aufgaben mit mehreren Referenzen. Die Leistungsdiagramme zeigen FLUX.2 (klein) an der Pareto-Grenze von Elo-Rating versus Latenz und Elo-Rating versus VRAM. Im Kommentar heißt es, dass FLUX.2 (klein) die Qualität von Qwen-basierten Bildmodellen bei einem Bruchteil der Latenz und des VRAM erreicht oder übertrifft und dass es Z Picture übertrifft und gleichzeitig einheitliche Textual content-zu-Bild- und Multi-Referenz-Bearbeitung in einer Architektur unterstützt.

Bei den Basisvarianten muss etwas Geschwindigkeit gegen vollständige Anpassbarkeit und Feinabstimmung eingetauscht werden, was ihrer Rolle als grundlegende Kontrollpunkte für neue Forschung und domänenspezifische Pipelines entspricht.
Wichtige Erkenntnisse
- FLUX.2 (klein) ist eine kompakte gleichgerichtete Flusstransformatorfamilie mit 4B- und 9B-Varianten, die Textual content-zu-Bild, Einzelbildbearbeitung und Mehrfachreferenzgenerierung in einer einheitlichen Architektur unterstützt.
- Die destillierten FLUX.2 (klein) 4B- und 9B-Modelle verwenden 4 Sampling-Schritte und sind für die Inferenz in Sekundenbruchteilen auf einer einzigen modernen GPU optimiert, während die undestillierten Basismodelle längere Zeitpläne verwenden und für Feinabstimmung und Forschung gedacht sind.
- Mit NVIDIA erstellte quantisierte FP8- und NVFP4-Varianten bieten eine bis zu 1,6-fache Beschleunigung mit etwa 40 Prozent VRAM-Reduzierung für FP8 und eine bis zu 2,7-fache Beschleunigung mit etwa 55 Prozent VRAM-Reduzierung für NVFP4 auf RTX-GPUs.
Schauen Sie sich das an Technische Particulars, Repo Und Modellgewichte. Sie können uns auch gerne weiter folgen Twitter und vergessen Sie nicht, bei uns mitzumachen 100.000+ ML SubReddit und Abonnieren Unser Publication. Warten! Bist du im Telegram? Jetzt können Sie uns auch per Telegram kontaktieren.
Der Beitrag Black Forest Labs veröffentlicht FLUX.2 (klein): Kompakte Strömungsmodelle für interaktive visuelle Intelligenz erschien zuerst auf MarkTechPost.
