Wir alle sollten zugeben, dass der September der Monat conflict Gemini Nano Banane. Jeder hat mit dem Modell herumgespielt und schrullige Bearbeitungen und lustige Selfies in den sozialen Medien veröffentlicht. Die Chancen stehen intestine, dass Sie es auch ausprobiert haben oder zumindest ein Dutzend dieser Promi -Mashups und 3D -Figur -Pfosten in Ihrem Feed vorbeigefahren haben. Aber während Nano Banana die lässige Seite der Bildgenerierung dominiert hat, hat Qwen das professionelle Bearbeitungsspiel leise auferlegt. Erst letzten Monat hat das Workforce Qwen-Picture-Edit veröffentlicht, und jetzt sind sie mit einer verbesserten Model zurück: Qwen-Picture-Edit-2509, die sich auf Konsistenz, Flexibilität und Kontrolle konzentriert. Im Vergleich zur Veröffentlichung im August macht das neue Replace für Schöpfer, Entwickler und Forscher leistungsfähiger, während sie dennoch für alle zugänglich bleiben, die experimentieren möchten.
Wenn Sie mehr über das Vorgängermodell erfahren möchten, lesen Sie unseren detaillierten Artikel über Qwen-Picture-Edit!
Was ist neu in Qwen-Picture-Edit-2509?
Im Vergleich zur Veröffentlichung des letzten Monats führt diese Model vier wichtige Verbesserungen vor:
Multi-Picture-Bearbeitungsunterstützung
Mit Qwen-Picture-Edit-2509 können Sie jetzt mehrere Bilder gleichzeitig bearbeiten. Das Modell wurde unter Verwendung von Bildverzögerung geschult, wodurch nahtlose Bearbeitungen über Kombinationen hinweg wie folgt ermöglicht werden:
- Particular person + Particular person
- Particular person + Produkt
- Particular person + Szene
Es funktioniert am besten mit 1–3 Eingangsbildern und integriert sich auch intestine in ControlNET -Karten wie Tastoint für Pose -Änderungen.
Verbesserte Ein-Picture-Konsistenz
Bei der Bearbeitung eines einzelnen Bildes konzentriert sich das September -Replace stark auf die Konsistenz:
- Particular person Bearbeitung: Gesichter behalten ihre Identität über verschiedene Posen und Porträtstile hinweg.
- Produktbearbeitung: Logos und Objekte behalten ihr Aussehen bei und machen Produktplakate einfacher zu generieren.
- Textbearbeitung: Sie können nicht nur die Wörter ändern, sondern auch Schriftarten, Farben und Materialien mit Präzision anpassen.
Native ControlNET -Unterstützung
Das Replace fügt eine reibungslose Integration mit ControlNET -Eingängen wie Tiefenkarten, Edge -Karten und Tastoint -Karten hinzu und erweitert die kreative Kontrolle für technische und künstlerische Anwendungsfälle.
Verbesserte Textintegration + Bildintegration
Qwen-Picture-edit-2509 kann jetzt die Textbearbeitung nahtlos mit Bildmanipulation mischen. Das Entwerfen eines Posters, auf dem Schriftarten, Stile und Visuals konsequent interagieren.
Lesen Sie auch: Qwen3-omni Evaluation: Multimodales Kraftpaket oder überprüftes Versprechen?
Praktische Aufforderungen zum Versuchen mit Qwen-Picture-Edit-2509
Für all diese Aufgaben verwende ich sowohl Qwen-Picture-Edit-2509- als auch Nano-Banane, um die Ausgaben zu vergleichen und zu sehen, wie Qwen bei jeder Aufgabe funktioniert.
Aufgabe 1: Particular person + Particular person
Immediate: “Verwenden Sie Bild A und Bild B. Fucken Sie sie in ein Foto, auf dem beide Personen auf einer Parkbank sitzen. Gesichtsidentität und natürliche Beleuchtung bewahren. ““

Das neue Merkmal des QWEN Picture -Bearbeitungsmodells bemüht sich immer noch darum, die Gesichtszüge intakt zu halten. Wie Sie im obigen Bild sehen können, hat Nano Banane die Gesichter beider Menschen besser beibehalten. Qwen veränderte auch die Tasche im Originalbild, während Nano Banane sie unverändert hielt.
Aufgabe 2: Particular person + Szene
Immediate: „Legen Sie dieses Porträt nachts in eine geschäftige Tokyo -Straße mit Neonschildern. Halten Sie die Gesichtsidentität und den korrekten Hautton.“

Qwen hat großartige Arbeit geleistet, um die Gesichtsausdrücke und die allgemeine Bildqualität beizubehalten. Die Blitz- und Gesamtbildmischung sieht intestine aus. Nano Banane ging jedoch einen Schritt voraus und bearbeitete den Hintergrundlitz nach dem Foto, wodurch es realer aussah.
Aufgabe 3: Particular person + Produktanzeige
Immediate: „Verwenden Sie dieses Porträt und dieses Produktbild. Lassen Sie es wie eine Anzeige aussehen, in der die Particular person das Produkt hält. Halten Sie das Produktetikett lesbar.“

Für diese Aufgabe habe ich die Bilder sowohl des Modells als auch des Produkts in beide Modelle mit derselben Eingabeaufforderung hinzugefügt. Die Ausgabe von Qwen sieht besser aus, während die Nano -Banane die beiden Fotos einfach zusammengestellt hat, ohne viel darüber nachzudenken, sie zu kombinieren.
Aufgabe 4: Pose Management mit Tastoint Map stellen
Die folgenden Bilder zeigen den Prozess, bei dem eine Tastoint -Pose -Karte aus einem Bild verwendet wird, um eine bestimmte Haltung in ein anderes Bild in ein anderes Bild zu übertragen und gleichzeitig ihre Gesichtsidentität zu erhalten. Die Beispiele zeigen auch, wie diese Technologie mit anderen komplexen Bearbeitungsaufgaben kombiniert werden kann, z. B. das Ändern des Hintergrunds und die Manipulation von Objekten.

Ich habe diese neue Funktion von QWEN in der folgenden Eingabeaufforderung verwendet:
Immediate: „Verwenden Sie dieses Porträt und diese Tastoint -Pose -Karte. Rücken Sie die Particular person auf, um die Karte zu entsprechen und gleichzeitig die Gesichtsidentität zu halten.“

Qwen Picture Edit hat explizite Unterstützung für die keypointgestützte Bearbeitung. Deshalb synchronisierte Ihre Sketch + Tastoint Overlay perfekt. Es weiß, wie man die Keypoint -Karte liest, und dann die Technology zu konditionieren. Wenn Sie mit Posen, Blickwinkeln, Haltung oder Interaktionen mit Orientierungspunkten spielen möchten (wie Eiffelturm, Qutub Minar, Taj Mahal, Akshardham), sollten Sie sich bei Qwen Picture Edit (oder einem Modell, in dem „Pose Management“ / „Keypoint Conditioning“) festhalten.
Nano Banane hat jedoch keine Keypoint-Map-Konditionierungspipeline. Aus diesem Grund hat es gerade Ihr Eingabebild ohne Änderungen wieder aufgenommen: Es kann nach Stil, Textur, Hintergrund-Swaps usw. bearbeiten, aber es analysiert oder durchsetzen Sie keine Karten von Menschen/Objekten.
Aufgabe 5: Textual content zum Bild hinzufügen
Immediate: „Das Mädchen im hochgeladenen Bild hält eine Kreidebrett mit dem Textual content“ Mach mich meiner Genai -Meisterklasse an, um ein Experte im Jahr 2025 „zu werden“, geschrieben darauf.

Zwischen den beiden Antworten ist Qwens Ausgabe eindeutig besser. In der QWEN -Model sitzt der Textual content auf natürliche Weise auf der Tafel, ist ordnungsgemäß mit der Perspektive ausgerichtet und sieht so aus, als ob er tatsächlich auf eine Tafel gehört. Der Schriftstil ist konsistent, sauber und sehr lesbar, wodurch die Botschaft klarer wirkt. Der Textual content fügt sich nahtlos in die Boardoberfläche ein, sodass sich das Endergebnis authentisch und realistisch anfühlt.
Andererseits sieht Geminis Antwort eher wie eine digitale Overlay aus. Die Textausrichtung stimmt nicht vollständig mit dem Winkel des Boards überein, und der Schriftartstil erscheint weniger wie Kreideschreiben als eher wie digitale Standardtext. Aus diesem Grund fühlt sich der Textual content so an, als würde er eher auf das Board geklebt als in ihn integriert.
Aufgabe 6: Cartoon- oder Anime -Variante
Immediate: „Verwandeln Sie dieses Bild in einen Anime -Stil -Charakter, während Sie die gleiche Gesichtsidentität und denselben Ausdruck erhalten.“

Zwischen den beiden Ergebnissen ist die Model von Qwen-Picture-Edit-2509 eindeutig besser, da sie die Particular person vollständig in einen Anime-Stil-Charakter verwandelt und gleichzeitig das gleiche Outfit, das gleiche Pose und den Ausdruck beibehält, und es der Aufgabe der Aufgabe treu, während Nano-Banana-Model quick identisch mit dem Enter-Foto mit einem kleinen Anime-Stylizing-Retouch-Retouch-Retouch-Retouch-Retouch-Retoucher-Erfordernis und einem Anime-Erfordernis und dem Anfordern.
Aufgabe 7: Produktplakat
Immediate: „Machen Sie eine saubere marktfähige Poster für diesen Schuh. Verwenden Sie einen einfachen Hintergrund. Fügen Sie den Produktnamen unten fettem Typ hinzu – Soulshoe „.

Zwischen den beiden ist Qwens Poster besser, weil es über ein einfaches Schaufenster hinausgeht und das Produkt tatsächlich vermarktet. Der leuchtende Effekt lässt die Schuhe hervorheben, der Slogan „Wo Consolation trifft Model“ fügt emotionale Anziehungskraft hinzu, und der Abzeichen „Restricted Version“ schafft Dringlichkeit, die sie alle wie eine polierte Werbekampagne aussehen lässt, während Geminis Ausgabe, obwohl sie sauber und professionell ist, eher wie ein einfaches Katalogbild als ein marktfähiges Poster anfühlt.
Mein Urteil
Nano Banane macht Spaß, ist zugänglich und sofort gemeinsam genutzt. Perfekt für Meme, Selfies und soziale Tendencies. Qwen hingegen ist strukturiert, vielseitig und produktionsbereit, was es zur besseren Wahl für Schöpfer, Designer und Fachkräfte macht, die Zuverlässigkeit in Bezug auf Outputs wünschen.
Lesen Sie auch:
Abschluss
KI -Bildmodelle verbessern sich Monat zu Monat. August gab uns das erste Qwen -Bild. Der September hat uns diese neue Model mit Multi -Picture -Unterstützung und besserer Konsistenz gegeben. Nächsten Monat, wer weiß, was kommen wird. Wenn Sie es lieben, zu experimentieren, öffnen Sie Qwen Chat und probieren Sie die Aufforderungen aus, die ich geteilt habe. Beginnen Sie mit etwas Einfachem, als sich selbst in einen neuen Hintergrund zu setzen. Wechseln Sie dann zu Multi -Bild -Bearbeitungen und -Plaksen.
Ich werde weiter testen und teilen, was funktioniert. Wenn Sie eine dieser Eingaben ausprobieren, lassen Sie mich wissen, welches Ergebnis Sie haben. Manchmal ist der Spaß in den Überraschungen.
Melden Sie sich an, um weiter zu lesen und Experten-Kuratinhalte zu genießen.
