Wir alle sollten zugeben, dass der September der Monat conflict Gemini Nano Banane. Jeder hat mit dem Modell herumgespielt und schrullige Bearbeitungen und lustige Selfies in den sozialen Medien veröffentlicht. Die Chancen stehen intestine, dass Sie es auch ausprobiert haben oder zumindest ein Dutzend dieser Promi -Mashups und 3D -Figur -Pfosten in Ihrem Feed vorbeigefahren haben. Aber während Nano Banana die lässige Seite der Bildgenerierung dominiert hat, hat Qwen das professionelle Bearbeitungsspiel leise auferlegt. Erst letzten Monat hat das Workforce Qwen-Picture-Edit veröffentlicht, und jetzt sind sie mit einer verbesserten Model zurück: Qwen-Picture-Edit-2509, die sich auf Konsistenz, Flexibilität und Kontrolle konzentriert. Im Vergleich zur Veröffentlichung im August macht das neue Replace für Schöpfer, Entwickler und Forscher leistungsfähiger, während sie dennoch für alle zugänglich bleiben, die experimentieren möchten.

Wenn Sie mehr über das Vorgängermodell erfahren möchten, lesen Sie unseren detaillierten Artikel über Qwen-Picture-Edit!

Was ist neu in Qwen-Picture-Edit-2509?

Im Vergleich zur Veröffentlichung des letzten Monats führt diese Model vier wichtige Verbesserungen vor:

Multi-Picture-Bearbeitungsunterstützung

Mit Qwen-Picture-Edit-2509 können Sie jetzt mehrere Bilder gleichzeitig bearbeiten. Das Modell wurde unter Verwendung von Bildverzögerung geschult, wodurch nahtlose Bearbeitungen über Kombinationen hinweg wie folgt ermöglicht werden:

  • Particular person + Particular person
  • Particular person + Produkt
  • Particular person + Szene

Es funktioniert am besten mit 1–3 Eingangsbildern und integriert sich auch intestine in ControlNET -Karten wie Tastoint für Pose -Änderungen.

Verbesserte Ein-Picture-Konsistenz

Bei der Bearbeitung eines einzelnen Bildes konzentriert sich das September -Replace stark auf die Konsistenz:

  • Particular person Bearbeitung: Gesichter behalten ihre Identität über verschiedene Posen und Porträtstile hinweg.
  • Produktbearbeitung: Logos und Objekte behalten ihr Aussehen bei und machen Produktplakate einfacher zu generieren.
  • Textbearbeitung: Sie können nicht nur die Wörter ändern, sondern auch Schriftarten, Farben und Materialien mit Präzision anpassen.

Native ControlNET -Unterstützung

Das Replace fügt eine reibungslose Integration mit ControlNET -Eingängen wie Tiefenkarten, Edge -Karten und Tastoint -Karten hinzu und erweitert die kreative Kontrolle für technische und künstlerische Anwendungsfälle.

Verbesserte Textintegration + Bildintegration

Qwen-Picture-edit-2509 kann jetzt die Textbearbeitung nahtlos mit Bildmanipulation mischen. Das Entwerfen eines Posters, auf dem Schriftarten, Stile und Visuals konsequent interagieren.

Lesen Sie auch: Qwen3-omni Evaluation: Multimodales Kraftpaket oder überprüftes Versprechen?

Praktische Aufforderungen zum Versuchen mit Qwen-Picture-Edit-2509

Für all diese Aufgaben verwende ich sowohl Qwen-Picture-Edit-2509- als auch Nano-Banane, um die Ausgaben zu vergleichen und zu sehen, wie Qwen bei jeder Aufgabe funktioniert.

Aufgabe 1: Particular person + Particular person

Immediate:Verwenden Sie Bild A und Bild B. Fucken Sie sie in ein Foto, auf dem beide Personen auf einer Parkbank sitzen. Gesichtsidentität und natürliche Beleuchtung bewahren. ““

Qwen-Image-Edit-2509 | Person + Person verschmelzen

Das neue Merkmal des QWEN Picture -Bearbeitungsmodells bemüht sich immer noch darum, die Gesichtszüge intakt zu halten. Wie Sie im obigen Bild sehen können, hat Nano Banane die Gesichter beider Menschen besser beibehalten. Qwen veränderte auch die Tasche im Originalbild, während Nano Banane sie unverändert hielt.

Aufgabe 2: Particular person + Szene

Immediate: „Legen Sie dieses Porträt nachts in eine geschäftige Tokyo -Straße mit Neonschildern. Halten Sie die Gesichtsidentität und den korrekten Hautton.“

Person Plus Szene _ Qwen Bild bearbeiten

Qwen hat großartige Arbeit geleistet, um die Gesichtsausdrücke und die allgemeine Bildqualität beizubehalten. Die Blitz- und Gesamtbildmischung sieht intestine aus. Nano Banane ging jedoch einen Schritt voraus und bearbeitete den Hintergrundlitz nach dem Foto, wodurch es realer aussah.

Aufgabe 3: Particular person + Produktanzeige

Immediate: „Verwenden Sie dieses Porträt und dieses Produktbild. Lassen Sie es wie eine Anzeige aussehen, in der die Particular person das Produkt hält. Halten Sie das Produktetikett lesbar.“

Person + Produktanzeige

Für diese Aufgabe habe ich die Bilder sowohl des Modells als auch des Produkts in beide Modelle mit derselben Eingabeaufforderung hinzugefügt. Die Ausgabe von Qwen sieht besser aus, während die Nano -Banane die beiden Fotos einfach zusammengestellt hat, ohne viel darüber nachzudenken, sie zu kombinieren.

Aufgabe 4: Pose Management mit Tastoint Map stellen

Die folgenden Bilder zeigen den Prozess, bei dem eine Tastoint -Pose -Karte aus einem Bild verwendet wird, um eine bestimmte Haltung in ein anderes Bild in ein anderes Bild zu übertragen und gleichzeitig ihre Gesichtsidentität zu erhalten. Die Beispiele zeigen auch, wie diese Technologie mit anderen komplexen Bearbeitungsaufgaben kombiniert werden kann, z. B. das Ändern des Hintergrunds und die Manipulation von Objekten.

Qwen-Image-Edit-2509 | Stellen Sie die Steuerung und die wichtigste Punktkarte auf

Ich habe diese neue Funktion von QWEN in der folgenden Eingabeaufforderung verwendet:

Immediate: „Verwenden Sie dieses Porträt und diese Tastoint -Pose -Karte. Rücken Sie die Particular person auf, um die Karte zu entsprechen und gleichzeitig die Gesichtsidentität zu halten.“

Stellen Sie die Steuerung mit Tastoint -Karte auf

Qwen Picture Edit hat explizite Unterstützung für die keypointgestützte Bearbeitung. Deshalb synchronisierte Ihre Sketch + Tastoint Overlay perfekt. Es weiß, wie man die Keypoint -Karte liest, und dann die Technology zu konditionieren. Wenn Sie mit Posen, Blickwinkeln, Haltung oder Interaktionen mit Orientierungspunkten spielen möchten (wie Eiffelturm, Qutub Minar, Taj Mahal, Akshardham), sollten Sie sich bei Qwen Picture Edit (oder einem Modell, in dem „Pose Management“ / „Keypoint Conditioning“) festhalten.

Nano Banane hat jedoch keine Keypoint-Map-Konditionierungspipeline. Aus diesem Grund hat es gerade Ihr Eingabebild ohne Änderungen wieder aufgenommen: Es kann nach Stil, Textur, Hintergrund-Swaps usw. bearbeiten, aber es analysiert oder durchsetzen Sie keine Karten von Menschen/Objekten.

Aufgabe 5: Textual content zum Bild hinzufügen

Immediate: „Das Mädchen im hochgeladenen Bild hält eine Kreidebrett mit dem Textual content“ Mach mich meiner Genai -Meisterklasse an, um ein Experte im Jahr 2025 „zu werden“, geschrieben darauf.

Qwen-Image-Edit-2509 | Bild bearbeiten mit Text

Zwischen den beiden Antworten ist Qwens Ausgabe eindeutig besser. In der QWEN -Model sitzt der Textual content auf natürliche Weise auf der Tafel, ist ordnungsgemäß mit der Perspektive ausgerichtet und sieht so aus, als ob er tatsächlich auf eine Tafel gehört. Der Schriftstil ist konsistent, sauber und sehr lesbar, wodurch die Botschaft klarer wirkt. Der Textual content fügt sich nahtlos in die Boardoberfläche ein, sodass sich das Endergebnis authentisch und realistisch anfühlt.

Andererseits sieht Geminis Antwort eher wie eine digitale Overlay aus. Die Textausrichtung stimmt nicht vollständig mit dem Winkel des Boards überein, und der Schriftartstil erscheint weniger wie Kreideschreiben als eher wie digitale Standardtext. Aus diesem Grund fühlt sich der Textual content so an, als würde er eher auf das Board geklebt als in ihn integriert.

Aufgabe 6: Cartoon- oder Anime -Variante

Immediate: „Verwandeln Sie dieses Bild in einen Anime -Stil -Charakter, während Sie die gleiche Gesichtsidentität und denselben Ausdruck erhalten.“

Cartoon- oder Anime -Variante

Zwischen den beiden Ergebnissen ist die Model von Qwen-Picture-Edit-2509 eindeutig besser, da sie die Particular person vollständig in einen Anime-Stil-Charakter verwandelt und gleichzeitig das gleiche Outfit, das gleiche Pose und den Ausdruck beibehält, und es der Aufgabe der Aufgabe treu, während Nano-Banana-Model quick identisch mit dem Enter-Foto mit einem kleinen Anime-Stylizing-Retouch-Retouch-Retouch-Retouch-Retouch-Retoucher-Erfordernis und einem Anime-Erfordernis und dem Anfordern.

Aufgabe 7: Produktplakat

Immediate: „Machen Sie eine saubere marktfähige Poster für diesen Schuh. Verwenden Sie einen einfachen Hintergrund. Fügen Sie den Produktnamen unten fettem Typ hinzu – Soulshoe „.

Produktplakat

Zwischen den beiden ist Qwens Poster besser, weil es über ein einfaches Schaufenster hinausgeht und das Produkt tatsächlich vermarktet. Der leuchtende Effekt lässt die Schuhe hervorheben, der Slogan „Wo Consolation trifft Model“ fügt emotionale Anziehungskraft hinzu, und der Abzeichen „Restricted Version“ schafft Dringlichkeit, die sie alle wie eine polierte Werbekampagne aussehen lässt, während Geminis Ausgabe, obwohl sie sauber und professionell ist, eher wie ein einfaches Katalogbild als ein marktfähiges Poster anfühlt.

Mein Urteil

Nano Banane macht Spaß, ist zugänglich und sofort gemeinsam genutzt. Perfekt für Meme, Selfies und soziale Tendencies. Qwen hingegen ist strukturiert, vielseitig und produktionsbereit, was es zur besseren Wahl für Schöpfer, Designer und Fachkräfte macht, die Zuverlässigkeit in Bezug auf Outputs wünschen.

Lesen Sie auch:

Abschluss

KI -Bildmodelle verbessern sich Monat zu Monat. August gab uns das erste Qwen -Bild. Der September hat uns diese neue Model mit Multi -Picture -Unterstützung und besserer Konsistenz gegeben. Nächsten Monat, wer weiß, was kommen wird. Wenn Sie es lieben, zu experimentieren, öffnen Sie Qwen Chat und probieren Sie die Aufforderungen aus, die ich geteilt habe. Beginnen Sie mit etwas Einfachem, als sich selbst in einen neuen Hintergrund zu setzen. Wechseln Sie dann zu Multi -Bild -Bearbeitungen und -Plaksen.

Ich werde weiter testen und teilen, was funktioniert. Wenn Sie eine dieser Eingaben ausprobieren, lassen Sie mich wissen, welches Ergebnis Sie haben. Manchmal ist der Spaß in den Überraschungen.

Hallo, ich bin Nitika, ein technisch versierter Content material-Ersteller und Vermarkter. Kreativität und neue Dinge lernen natürlich für mich. Ich habe Fachkenntnisse bei der Erstellung von ergebnisgesteuerten Inhaltsstrategien. Ich bin mit web optimization -Administration, Key phrase -Operationen, Webinhalten, Kommunikation, Inhaltsstrategie, Bearbeitung und Schreiben intestine vertraut.

Melden Sie sich an, um weiter zu lesen und Experten-Kuratinhalte zu genießen.

Von admin

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert