entwickelt

NVIDIA veröffentlicht PersonaPlex-7B-v1: ein Echtzeit-Speech-to-Speech-Modell, das für natürliche und Vollduplex-Gespräche entwickelt wurde

NVIDIA-Forscher haben PersonaPlex-7B-v1 veröffentlicht, ein Vollduplex-Speech-to-Speech-Konversationsmodell, das auf natürliche Sprachinteraktionen mit präziser Persona-Steuerung abzielt. Von ASR→LLM→TTS zu einem einzelnen Vollduplex-Modell Herkömmliche Sprachassistenten betreiben meist eine Kaskade. Die automatische Spracherkennung (ASR)…

DeepSeek hat gerade ein 3B-OCR-Modell veröffentlicht: ein 3B-VLM, das für leistungsstarke OCR und strukturierte Dokumentenkonvertierung entwickelt wurde

DeepSeek-AI hat 3B DeepSeek-OCR veröffentlicht, ein Finish-to-Finish-OCR- und Dokumentenparsing-Imaginative and prescient-Language-Mannequin-(VLM)-System, das langen Textual content in einen kleinen Satz von Imaginative and prescient-Tokens komprimiert und diese Token dann mit einem…

Qualifire AI Open-Sources Rogue: Ein Finish-to-Finish-Framework für Agenten-KI-Checks, das zur Bewertung der Leistung, Compliance und Zuverlässigkeit von KI-Agenten entwickelt wurde

Agentensysteme sind stochastisch, kontextabhängig und richtliniengebunden. Herkömmliche Qualitätssicherung – Unit-Checks, statische Eingabeaufforderungen oder skalare „LLM-as-a-Decide“-Bewertungen – deckt Multi-Flip-Schwachstellen nicht auf und liefert schwache Prüfpfade. Entwicklerteams benötigen protokollgenaue Gespräche, explizite Richtlinienprüfungen…