- Google sucht nach Videokonferenzen mit 3D-Avataren und automatischen Layoutverbesserungen für die Anzeige von Umgebungsgeräuschen und -einstellungen.
- ChatDirector, ein neuer Prototyp, wird voraussichtlich von erfahrenen visuellen Assistenten in einer benutzerfreundlichen Umgebung verwendet.
Google ChatDirector Es handelt sich um einen Forschungsprototyp, der es ermöglicht, Videokonferenzen mit 3D-Avataren, integrierten 3D-Umgebungen und automatischer Layoutgestaltung auf der Grundlage von Daten durchzuführen. Das System ist so konzipiert, dass es eine sehr dynamische und realistische Benutzeroberfläche bietet und gleichzeitig praktische visuelle Assistenten enthält, die beim Führen von Gesprächen und beim Erledigen von Aufgaben hilfreich sind.
ChatDirector verwendet Technologien wie U-Web und MediaPipe, um die visuelle Umgebung des Deltas als 3D-Porträtavatare zu rekonstruieren und so die Umgebung und das gemeinsame Erlebnis mit einem herkömmlichen 2D-Videokonferenzsystem zu verbessern.
Googles ChatDirector ist eine Technik, die Videokonferenzen ermöglicht und mit deren Hilfe sich Szenen-Rendering und Layoutgestaltung optimieren lassen. Dieses System ermöglicht es Ihnen, die Anzeige von Dreiecken in einer Videosequenz auf der Grundlage Ihrer Place und Interaktionen im Raum zu steuern und gleichzeitig alle auf Gesprächsaktivität basierenden Anzeigeebenen zu verbessern. Mithilfe der Technik können Sie auf natürliche Weise ein höheres Niveau erreichen und mithilfe von Distanzmessungen Ihre deltagarnen Sicht auf den Boden optimieren.
Benötigen Sie eine Technologie, um 3D-Porträtavatare in ChatDirector zu erstellen?
Zum Erstellen von 3D-Porträtavataren und ChatDirector wird die folgende Technologie verwendet:
- U-Web: Ein leistungsstarkes DJ-Lesegerät, das DJ-Lesevorgänge mit Echtzeit-RGB-Webcam-Video ermöglicht.
- MediaPipe Selfie-Segmentierungsmodell: Verwenden Sie zum Formen von Segmenten Grundprinzipien.
- MediaPipe-Gesichtserkennung: Verwenden Sie zum Aufnehmen Ihrer Lieblingssendung die virtuelle Kamera, um einen visuellen Parallaxeneffekt zu erzielen.
- Net Speech API: Verwenden Sie zur Länderkennung und zum Identifizieren neuer Elemente Ihre Structure-Verbesserungen und Avatar-Einstellungen.
- WebRTC: Anwendungen zur Datenverarbeitung mit vielen Anwendungen, einschließlich Farbe, Textual content, RGB-Bildern und Dupbildern.
Diese Technologie kombiniert die Rekonstruktion und Darstellung von 3D-Porträtavataren in einer benutzerfreundlichen Umgebung.