OpenAI veröffentlicht GPT 5.1: So funktioniert es!
GPT 5.1 ist da. OpenAI nennt es den nächsten großen Schritt, und ehrlich gesagt fühlt es sich auch so an. Wann GPT-5 herauskam, waren die Leute von seiner Kraft erstaunt,…
GPT 5.1 ist da. OpenAI nennt es den nächsten großen Schritt, und ehrlich gesagt fühlt es sich auch so an. Wann GPT-5 herauskam, waren die Leute von seiner Kraft erstaunt,…
Wie kann die Sprachbearbeitung so direkt und kontrollierbar werden wie das einfache Umschreiben einer Textzeile? StepFun AI verfügt über die Open-Supply-Lösung Step-Audio-EditX, ein 3B-Parameter-LLM-basiertes Audiomodell, das ausdrucksstarke Sprachbearbeitung in eine…
Wie erstellen Sie zuverlässige KI-Agenten, die sich in Ihre bestehenden Go-Dienste integrieren lassen, ohne einen separaten Sprachstapel zu benötigen? Google hat gerade veröffentlicht Agent Improvement Equipment für Go. Go-Entwickler können…
Wie wandeln Sie echte Agentenverfolgungen in Reinforcement Studying RL-Übergänge um, um Richtlinien-LLMs zu verbessern, ohne Ihren bestehenden Agentenstapel zu ändern? Veröffentlichungen des Microsoft AI-Groups Agent Lightning zur Optimierung von Multiagentensystemen.…
Können wir lange Texte als Bilder rendern und einen VLM verwenden, um eine 3–4-fache Token-Komprimierung zu erreichen und dabei die Genauigkeit beizubehalten und gleichzeitig einen 128-KB-Kontext für 1-M-Token-Workloads zu skalieren?…
DeepSeek-AI hat 3B DeepSeek-OCR veröffentlicht, ein Finish-to-Finish-OCR- und Dokumentenparsing-Imaginative and prescient-Language-Mannequin-(VLM)-System, das langen Textual content in einen kleinen Satz von Imaginative and prescient-Tokens komprimiert und diese Token dann mit einem…
MAI-Picture-1 ist das neu entwickelte AI-Modell von Microsoft und enthält Bilder aus Textual content. Das ist optimum für den schnellen Zugriff, die interaktive Nutzung und die Generierung fotorealistischer Bilder mit…
Empfindungsfähige KI hat veröffentlicht ROMA (Rekursiver offener Meta-Agent)ein Open-Supply-Meta-Agent-Framework zum Aufbau leistungsstarker Multi-Agent-Systeme. ROMA strukturiert Agenten-Workflows als hierarchischer, rekursiver Aufgabenbaum: Übergeordnete Knoten unterteilen ein komplexes Ziel Teilaufgabengeben Sie sie an…
Wie viel Kapazität kann ein spärlicher 8.3B-Parameter MoE mit einem ~1,5B aktiver Pfad auf Ihrem Telefon liefern, ohne Latenz oder Speicher zu verschwenden? Liquid AI wurde veröffentlicht LFM2-8B-A1B, ein kleines…
Salesforce AI Analysis veröffentlicht Coda-1.7bein diffusionsbasiertes Sprachmodell für Code, das von generiert wird Denoising ganzer Sequenzen mit bidirektionalem KontextAktualisierung mehrere Token parallel eher anstatt von der nächsten nach rechts zu…