Bild: IBM

Armonk, NY, 26. Februar 2025 – IBM (NYSE: IBM) gab heute Ergänzungen zu seinem Granit -Portfolio von großsprachigen Modellen bekannt, die eine kleine, effiziente Unternehmens -KI liefern sollen.

Die neuen Granit 3.2 -Modelle umfassen:

  • Ein neues Imaginative and prescient Language Mannequin (VLM) für Dokumentenverständnisaufgaben, von denen IBM die Leistung zeigt, die dem von signifikant größeren Modellen übereinstimmt oder übersteigt – Lama 3.2 11b und Pixtral 12b – Auf Enterprise Benchmarks Docvqa, Chartqa, AI2D und Ocrbench1. Zusätzlich zu den Schulungsdaten verwendete IBM seine eigene Open-Supply Docling -Toolkit Um 85 Millionen PDFs zu verarbeiten und 26 Millionen synthetische Fragen-Antwortenpaare zu erzeugen, um die Fähigkeit des VLM zu verbessern, komplexe dokument-fahre störende Workflows zu bewältigen, so das Unternehmen.
  • Fähigkeiten der Kette der Gedanken für verstärktes Denken in der 3.2 2B Und 8b Modelle, mit der Möglichkeit, das Denken ein- oder auszuschalten, um die Effizienz zu optimieren. Mit dieser Fähigkeit die 8b Das Modell erzielt zweistellige Verbesserungen des Vorgängers in Anweisungen, die Benchmarks wie Arenahard und Alpaca Eval ohne Sicherheit oder Leistung an anderer Stelle beeinträchtigen2. Mit der Verwendung von Neuartige Inferenz -Skalierungsmethodender Granit 3.2 8b Modell kann kalibriert werden, um mit der Leistung viel größerer Modelle wie Claude 3.5 Sonett oder GPT-4O in den Benchmarks von Mathematik wie Aime2024 und MATH500 mithalten zu können3Sagte IBM.
  • Verkleinerte Größenoptionen für Granit-Guardian-Sicherheitsmodelle, die die Leistung früherer Granit 3.1-Wächtermodelle bei einer Größe von 30 Prozent aufrechterhalten. Die 3.2 -Modelle führen auch eine neue Funktion namens verbalisiertes Vertrauen ein, dass IBM laut IBM eine nuanciertere Risikobewertung anbietet, die Unklarheiten bei der Sicherheitsüberwachung anerkennt.

Das Unternehmen sagte, dass Granite 3.2 -Modelle im Rahmen der zulässigen Apache 2.0 -Lizenz für das Umarmungsgesicht erhältlich sind. Ausgewählte Modelle sind heute auf IBM Watsonx.ai, Ollama, Replicate und LM Studio erhältlich und werden in RHEL AI 1.5 in Kürze erwartet.

IBM sagte, seine Strategie zur Bereitstellung kleinerer, spezialisierter KI -Modelle für Unternehmen zeigt weiterhin die Wirksamkeit beim Check mit dem Granit 3.1 8b Modell, das kürzlich hohe Noten für Genauigkeit in der gibt Salesforce LLM Benchmark für CRM.

Die Granite Mannequin -Familie wird von einem Ökosystem von Partnern unterstützt, darunter Softwareunternehmen, die die LLMs in ihre Technologien einbetten. „Bei CrushBank haben wir aus erster Hand gesehen, wie die offenen, effizienten KI-Modelle von IBM für Enterprise KI einen echten Wert bieten, der das richtige Gleichgewicht zwischen Leistung, Kosteneffizienz und Skalierbarkeit bietet“ David TanCTO, CrushBank. „Granite 3.2 nimmt es mit neuen Argumentationsfunktionen weiter und wir freuen uns, sie beim Aufbau neuer Agentenlösungen zu erkunden.“

Laut IBM ist Granite 3.2 ein wichtiger Schritt in der Entwicklung des Portfolios und der Strategie von IBM zur Bereitstellung einer kleinen, praktischen KI für Unternehmen.

„Während die Argumentationskette für Denkansätze leistungsfähig sind, erfordern sie eine erhebliche Rechenleistung, die für jede Aufgabe nicht erforderlich ist“, sagte das Unternehmen in seiner Ankündigung. „Deshalb hat IBM die Fähigkeit eingeführt, die Denkkette programmgesteuert oder auszuschalten. Für einfachere Aufgaben kann das Modell ohne Argumentation arbeiten, um unnötige Rechenaufwand zu reduzieren. Zusätzlich haben andere Argumentationstechniken wie Inferenzskalierung gezeigt, dass der Granit 3.2 8b Das Modell kann mit der Leistung viel größerer Modelle für Normal -Benchmarks von Normal -Mathematik -Argumenten übereinstimmen oder überschreiten. Entwicklungsmethoden wie Inferenzskalierung bleiben ein wesentlicher Schwerpunkt für IBM -Forschungsteams. “4

Neben Granite 3.2 Anweisungen, Seh- und Leitplanken veröffentlicht IBM die nächste Technology seiner TTM -Modelle (TinyTimemixer) (Sub 10 m Parameter) mit Funktionen für längerfristige Prognosen bis zu zwei Jahre in der Zukunft. Diese sorgen für leistungsstarke Instrumente in der langfristigen Trendanalyse, einschließlich Finanz- und Ökonomie-Traits, Prognose für die Nachfrage nach Lieferketten und saisonaler Bestandsplanung im Einzelhandel.

„In der nächsten Ära der KI geht es um Effizienz, Integration und reale Auswirkungen-bei der Unternehmen leistungsstarke Ergebnisse erzielen können, ohne dass es sich Sriram RaghavanVP, IBM AI -Forschung. „Die neuesten Granitentwicklungen von IBM konzentrieren sich auf offene Lösungen, die einen weiteren Schritt nach vorne zeigen, um KI für moderne Unternehmen zugänglicher, kostengünstiger und wertvoller zu machen.“



Von admin

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert