OpenAI wurde offiziell veröffentlicht Soraam dritten Tag ihrer „12 Days of OpenAI“-Reihe. Nach Monaten der Spannung seit seiner ersten Ankündigung im April 2024 hat sich Sora als großer Sprung im Bereich KI-generierter Videoinhalte erwiesen. OpenAI hat das Sora Turbo-Modell veröffentlicht, die beschleunigte Excessive-Finish-Model des ursprünglichen Sora-Modells. Schauen wir uns die neu hinzugefügten Funktionen an und probieren Sie es aus!

Was ist Sora?

Sora ist ein Textual content-zu-Video-Generator das nutzt fortgeschrittene Diffusionsmodelle Und Transformatorarchitekturen um Movies basierend auf schriftlichen Beschreibungen zu erstellen. Diese Movies werden erstellt, indem man mit Rauschen beginnt und es in mehreren Schritten schrittweise verfeinert. Dieser Diffusionsprozess ermöglicht es dem Modell, realistische, kohärente Videosequenzen aus einer Vielzahl von Texteingaben zu erstellen.

Aufbauend auf den früheren Erfolgen von OpenAI mit GPT, DALL·EUnd CLIPstellt Sora einen großen Fortschritt dar, indem es Benutzern ermöglicht, Movies von Grund auf zu erstellen oder bestehende auf der Grundlage von Texteingabeaufforderungen zu erweitern. Ob es darum geht, ein völlig neues Video zu erstellen oder ein Bild zu animieren, Soras Fähigkeit, visuell überzeugende Erzählungen direkt aus natürlicher Sprache zu erstellen, ist beispiellos.

Funktionen von OpenAI Sora

  • Movies aus Textual content generieren: Erstellen Sie Movies aus einfachen Textaufforderungen.
  • Vorhandene Movies erweitern: Bestehende Movies fortsetzen oder ändern.
  • Bilder animieren: Erwecken Sie Standbilder mit Animationen zum Leben.
  • Bewältigen Sie komplexe Szenen: Behalten Sie die Kontinuität über mehrere Frames hinweg bei.
  • Skalieren und anpassen: Erstellen Sie Movies in verschiedenen Formaten und Längen.
  • Transformationsvideos: Ändern Sie vorhandene Movies basierend auf Textaufforderungen.

Wichtige Verbesserungen

  • Realistische Physik: Natürlichere Objektbewegung.
  • Längere Movies: Erstellen Sie Movies mit einer Länge von bis zu 20 Sekunden.
  • Verbesserte Beleuchtung: Optisch ansprechendere Movies mit dynamischen Lichteffekten.

OpenAI Sora auf die Probe stellen

Immediate: Erstellen Sie ein Video über einen weißen Hund, der mit einem Kätzchen spielt

Immediate: Erstellen Sie ein Video von einem tanzenden Hund am Strand.

Storyboard-Eingabeaufforderung

Immediate:

  • Eine anschauliche Animation zeigt die Aufnahme eines psychotropen Moleküls, dargestellt als kleines, leuchtendes Partikel, das in den Mund gelangt. Der Hintergrund ist eine stilisierte Darstellung des menschlichen Verdauungssystems, wobei die wirbelnden Farben den Beginn einer komplexen Reise andeuten.
  • Das Molekül wandert durch den Blutkreislauf, umgeben von roten und weißen Blutkörperchen. Es wird als helles, leuchtendes Teilchen dargestellt, das sich schnell durch ein Netzwerk von Blutgefäßen bewegt.
  • Das Molekül erreicht die Blut-Hirn-Schranke, dargestellt als schimmernde Wand, durchdringt diese und dringt in das Gehirn ein. Die Szene wird komplexer, da Neuronen und Synapsen aufleuchten, wenn das Molekül mit ihnen interagiert.

Immediate:

  1. In einem heat erleuchteten Kinderzimmer sitzen ein kleiner Junge und ein kleines Mädchen in einer gemütlichen provisorischen Jurte aus karierten Decken und Kissen. Sie tragen verspielte Hüte und Filzstiefel und sind vom sanften Schein der Lampen umgeben. Die Kinder kichern, während sie mit einem Spielzeug-Rentier spielen, und ihre Augen funkeln vor Fantasie.
  2. Die Kinder schließen fest die Augen, ein Gefühl der Vorfreude liegt in der Luft.
  3. Wenn sie ihre Augen öffnen, verwandeln sie sich in Erwachsene und stehen vor einer modernen Hotellandschaft in Jakutien, umgeben von echten Jurten und einer riesigen, verschneiten Winterlandschaft.

Beobachtung: Beim Erstellen der Movies mit dem ChatGPT Plus Das Konto hat mich viel Zeit gekostet, ich sehe, dass es viel Raum für Verbesserungen gibt.

Wie greife ich auf Sora zu?

Sora ist über die neue Web site erreichbar – sora.com. Sie können Ihre ChatGPT-Pläne verwenden, um Zugriff auf das Modell zu erhalten:

  • ChatGPT Plus-Konto: Dieser Plan gibt Ihnen 50 Generationen professional Monat. Diese könnten mit der Anzahl der Textual content-zu-Video-Erstellungen oder anderen spezifischen Aufgaben professional Monat zusammenhängen.
  • OpenAI Professional-Konto: Das bietet unbegrenzte Generationen im langsamen Warteschlangenmodus, plus 500 schnellere Generationen professional Monat. Der Schwerpunkt dieser Stufe scheint darauf zu liegen, mehr Flexibilität zu bieten, mit der Possibility, Aufgaben für eine bestimmte Anzahl von Generationen schneller zu verarbeiten, während andere Aufgaben möglicherweise in die Warteschlange gestellt und langsamer verarbeitet werden.
  • Verfügbarkeit: Der Dienst steht dem nicht zur Verfügung Großbritannien und EU Dies kann aus rechtlichen, behördlichen oder datenschutzrechtlichen Gründen (z. B. DSGVO) erfolgen. Diese Einschränkung könnte in Zukunft aufgehoben werden, wenn das Unternehmen auf weitere Regionen expandiert.

OpenAI Sora-Funktionen

OpenAI Sora-Funktionen

Separates Produkt

  • Sora ist ein eigenständiges Produkt, das nicht in ChatGPT oder andere OpenAI-Plattformen integriert ist.
  • Erreichbar über Sora.comwo kürzlich erstellte und kuratierte Movies angezeigt werden.

Videoerstellung und -bearbeitung

  • Generieren Sie Movies aus Eingabeaufforderungen: Benutzer können Movies basierend auf Textaufforderungen erstellen.
  • Bilder hochladen: Benutzer können auch Bilder hochladen, mit denen Sora Movies erstellen kann.
  • Remix-Funktion: Ermöglicht Benutzern, Änderungen an vorhandenen Movies vorzunehmen, indem die gewünschten Änderungen beschrieben werden.
    • Stärkeeinstellung: Steuert, wie drastisch das Video verändert wird, wobei höhere Einstellungen zu stärkeren künstlerischen Veränderungen führen.
  • Videobearbeitung: Sora kann auch Movies bearbeiten, die ursprünglich mit dem Device generiert wurden.

Bild-Add und -Verbesserung

Bild-Upload und -Verbesserung
  • Bilder hochladen: Sie können damit beginnen, ein Bild hochzuladen, um ein Video zu erstellen. Dieses Bild kann als Foundation dienen und Sie können es mit weiteren Elementen, Textual content oder Animationen erweitern.
  • Textbeschreibung: Sie können das Bild auch mit Textual content beschreiben. Je detaillierter Ihre Beschreibung, desto konkreter folgt die Videoerstellung Ihren Anweisungen. Bei weniger detaillierten Beschreibungen füllt das Device die Lücken mit allgemeiner Kreativität und Particulars.

Themen (Voreinstellungen)

Sora-Themen
  • SORA bietet verschiedene Voreinstellungen, mit denen das Gesamtthema des Movies definiert werden kann. Einige Beispiele sind:
    • Ballonwelt: Diese Voreinstellung könnte eine skurrile oder traumhafte Atmosphäre schaffen.
    • Cease-Movement: Eine Voreinstellung, die den Cease-Movement-Animationsstil emuliert und Ihrem Video Bild für Bild ein handgefertigtes Aussehen verleiht.

Auswahl des Seitenverhältnisses

  • Sie können das Seitenverhältnis für Ihr Video auswählen. Zu den gängigen Optionen gehören:
    • 16:9 (Breitbild): Excellent für die meisten Movies, insbesondere für YouTube, Breitbildfilme usw.
    • 1:1 (Quadrat): Geeignet für Social-Media-Beiträge wie Instagram.
    • 9:16 (Vertikal): Perfekt für Plattformen wie TikTok oder Instagram Tales.

Videodauer

Dauer
  • Sie können die Dauer Ihres Movies auf bis zu einstellen 20 Sekundenwas Ihnen Flexibilität bei der Menge der enthaltenen Inhalte gibt.

Textual content- und Bildintegration

  • Die Plattform ermöglicht die Kombination von Textual content und Bildern für den kreativen Ausdruck:
    • Erstellen Sie durch Hochladen von Bildern: Sie laden ein Bild hoch, das als Grundlage für Ihr Video dient, und erweitern oder animieren es dann mit zusätzlichen Inhalten.
    • Textbasierte Erstellung: Sie können Szenen oder Bilder mit Textual content beschreiben. Je spezifischer der Textual content, desto mehr folgt das Video Ihrer Richtung. Beispielsweise wird das Video durch eine detaillierte Beschreibung angeleitet, die genauen Elemente wiederzugeben, die Sie erwähnen.

Storyboard (Erweiterte Erstellung)

Storyboard (Erweiterte Erstellung)
  • Für komplexere Videoprojekte, Storyboard Im Modus können Sie die Videoerstellung entlang einer Zeitleiste steuern. Dies bietet:
    • Kontrolle über die Reihenfolge: Sie können die Reihenfolge der Elemente (Textual content, Bilder und Movies) festlegen.
    • Erweiterte Bearbeitung: Es ermöglicht eine präzisere Anpassung und Abfolge von Szenen.
    • Multimedia-Integration: Sie können Bilder, Textual content und Videoclips kombinieren, um eine Erzählung oder eine komplexe visuelle Geschichte zu erstellen.

Videoqualität und Auflösung

Videoqualität und Auflösung
  • Auflösungsoptionen: Erzeugt Movies bis zu 1080p Auflösung.
    • 1080p-Filmmaterial dauert 8x länger zu generieren im Vergleich zu 480p, was die schnellste Possibility ist.
    • 720p dauert 4x länger als 480p.
    • 480p ist am schnellsten.
  • Durchschnittliche Generationszeit: A ein paar Minuten für ein 1080p-Video (je nach Benutzernachfrage und Datenverkehr).

Kurzgesagt,

SORA ist eine versatile, benutzerfreundliche Plattform zur Videoerstellung mit leistungsstarken Anpassungsoptionen. Du kannst:

  • Laden Sie Bilder hoch oder beschreiben Sie Szenen mit Textual content.
  • Wählen Sie aus verschiedenen Themenvoreinstellungen wie Balloon World oder Cease Movement.
  • Steuern Sie das Seitenverhältnis und die Videodauer.
  • Verwenden Sie den Storyboard-Modus für erweiterte Videobearbeitung und -sequenzierung.

Diese Kombination von Funktionen macht es Benutzern leicht, ansprechende, professionell aussehende Movies zu erstellen, selbst mit minimalen technischen Kenntnissen.

Diese Funktionen machen Sora zu einem leistungsstarken, aber immer noch unvollkommenen Device zum Generieren kreativer Videoinhalte, insbesondere für nicht fotorealistische, stilisierte Projekte.

Soras technische Grundlagen

Sora basiert im Wesentlichen auf dem Diffusionsmodelleine Technik, die mit zufälligem Rauschen beginnt und es iterativ zu einem zusammenhängenden Video verfeinert. Dieser Prozess spiegelt die Custom wider Bild-zu-Bild Diffusionsmodelle funktionieren, jedoch mit der zusätzlichen Komplexität von Videosequenzen.

Der Schlüssel zu Soras Innovation liegt in der Verwendung von Patch-basierte Darstellung sowohl für Bilder als auch für Movies. Ähnlich wie Token in GPT werden Movies und Bilder in Sora in kleinere „Datenfelder“ zerlegt. Dadurch kann das Modell große und komplexe visuelle Daten effizienter verarbeiten und Movies mit unterschiedlicher Dauer und Auflösung generieren.

Darüber hinaus baut Sora auf dem auf Recaptioning-Technik verwendet in DALL·E 3was es ihm ermöglicht, sehr aussagekräftige Untertitel für seine Trainingsdaten zu generieren. Diese Fähigkeit ermöglicht es dem Modell, Textaufforderungen genau zu folgen, was zu Movies führt, die den Benutzeranweisungen treu bleiben und besser auf die Eingabebeschreibung abgestimmt sind.

Lesen Sie auch: Was ist der Sora Diffusion Transformer (DiT) von OpenAI?

Ethische Überlegungen von OpenAI Sora

Folgendes erwartet Sora von Ihnen:

  1. Zustimmung: Laden Sie Medien mit Personen nur mit deren ausdrücklicher Erlaubnis hoch und stellen Sie sicher, dass Personen unter 18 Jahren über die entsprechende Einwilligung verfügen.
  2. Gewalt und explizite Themen: Laden Sie keine Inhalte hoch, die Gewalt, explizite Themen oder Inhalte für Erwachsene darstellen.
  3. Rechte an Medien: Stellen Sie sicher, dass Sie über die erforderlichen Eigentumsrechte oder Rechte zum Hochladen der von Ihnen freigegebenen Medien verfügen.
  4. Konsequenzen: Der Missbrauch der Plattform durch Verstöße gegen diese Regeln kann zur Sperrung oder Sperrung des Kontos ohne Rückerstattung führen.

Wichtige Erkenntnisse

Sora von OpenAI ist ein Textual content-zu-Video-Generator mit Funktionen wie Themen, Storyboard-Modus und Auflösungen von bis zu 1080p. Es weist jedoch erhebliche Einschränkungen auf. Movies sind auf 20 Sekunden begrenzt, was für längere Erzählungen möglicherweise nicht geeignet ist. Das Rendern mit hoher Auflösung (z. B. 1080p) ist zeitintensiv und verlangsamt die Generierung im Vergleich zu niedrigeren Auflösungen erheblich. Derzeit ist Sora im Vereinigten Königreich/in der EU aufgrund regulatorischer Probleme nicht verfügbar, was den Zugang einschränkt. Darüber hinaus schränken ethische Richtlinien die Nutzung ein und bei Verstößen besteht die Gefahr einer Kontosperrung. Sora ist leistungsstark, entwickelt sich jedoch weiter und bietet Raum für technische Verbesserungen und Verbesserungen bei der Zugänglichkeit. Außerdem ist die Generierungsgeschwindigkeit ziemlich langsam, was auf die hochauflösenden Movies zurückzuführen ist. Ich hoffe jedoch, dass es sich mit der Zeit verbessern wird, da OpenAI das Modell und die zugrunde liegende Infrastruktur weiter optimiert. Zukünftige Updates können zu schnelleren Generierungsgeschwindigkeiten führen, ohne die Qualität hochauflösender Movies zu beeinträchtigen, wodurch der Prozess effizienter und benutzerfreundlicher wird.

Abschluss

Soras letzte Veröffentlichung ist ein bemerkenswerter Meilenstein in der Entwicklung der künstlichen Intelligenz und vereint die neuesten Fortschritte in Verarbeitung natürlicher Sprache (NLP), Pc Imaginative and prescientUnd tiefes Lernen um hochwertige Kurzvideos direkt aus Textaufforderungen zu generieren. Die potenziellen Auswirkungen dieser Technologie sind weitreichend und reichen von der Kreativbranche bis hin zu Bildung, Advertising und darüber hinaus.

Die Imaginative and prescient von OpenAI für das Modell ist weitreichend, mit dem ultimativen Ziel, Systeme zu schaffen, die die reale Welt simulieren können, was uns der Verwirklichung einen Schritt näher bringt Künstliche Allgemeine Intelligenz (AGI). Mit der Weiterentwicklung von Sora werden seine Fähigkeiten wahrscheinlich erweitert und erweiterte Funktionen wie Echtzeit-Videogenerierung, interaktives Storytelling und sogar die Integration mit virtueller und erweiterter Realität umfassen.

Hast du es versucht? Teilen Sie mir Ihre Meinung im Kommentarbereich unten mit!

Hallo, ich bin Pankaj Singh Negi – Senior Content material Editor | Leidenschaft für das Geschichtenerzählen und die Erstellung überzeugender Erzählungen, die Ideen in wirkungsvolle Inhalte verwandeln. Ich liebe es, über Technologie zu lesen, die unseren Lebensstil revolutioniert.



Von admin

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert