veröffentlicht

DeepSeek hat gerade ein 3B-OCR-Modell veröffentlicht: ein 3B-VLM, das für leistungsstarke OCR und strukturierte Dokumentenkonvertierung entwickelt wurde

DeepSeek-AI hat 3B DeepSeek-OCR veröffentlicht, ein Finish-to-Finish-OCR- und Dokumentenparsing-Imaginative and prescient-Language-Mannequin-(VLM)-System, das langen Textual content in einen kleinen Satz von Imaginative and prescient-Tokens komprimiert und diese Token dann mit einem…

Sentient AI veröffentlicht ROMA: Ein Open-Supply- und AGI-fokussiertes Meta-Agent-Framework zum Aufbau von KI-Agenten mit hierarchischer Aufgabenausführung

Empfindungsfähige KI hat veröffentlicht ROMA (Rekursiver offener Meta-Agent)ein Open-Supply-Meta-Agent-Framework zum Aufbau leistungsstarker Multi-Agent-Systeme. ROMA strukturiert Agenten-Workflows als hierarchischer, rekursiver Aufgabenbaum: Übergeordnete Knoten unterteilen ein komplexes Ziel Teilaufgabengeben Sie sie an…

Servicenow AI veröffentlicht Apriel-1.5-15B-Thecher: Ein multimodales Argumentationsmodell mit offenen Gewichten

Servicenow AI Analysis Lab hat veröffentlicht Apriel-1.5-15B-Thecherein 15-Milliarden-Parameter-Open-Weights Multimodal Argumenting-Modell, das mit einem datenzentrierten ausgebildet ist Mitte Coaching Rezept-Kontinuelle Vorbeugung, gefolgt von beaufsichtigter Feinabstimmung-ohne Verstärkungslernen oder Präferenzoptimierung. Das Modell erreicht…

Alibaba Qwen Workforce hat gerade FP8-Builds von Qwen3-Subsequent-80B-A3B (unterrichtet & Considering) veröffentlicht und 80B/3B-Energetic Hybrid-Moe in die Commodity GPUs bringen

Das QWEN-Workforce von Alibaba hat gerade FP8-quantisierte Kontrollpunkte für seine neuen QWEN3-NEXT-80B-A3B-Modelle in zwei Nachtraining-Varianten veröffentlicht.Anweisen Und Denken-Ausgelassene Inferenz mit hohem Durchsatz mit extrem langer Kontext und MOE-Effizienz. Der FP8-Repos…