Geschrieben vom Smartech Day by day Group
Dieser Artikel wurde ursprünglich veröffentlicht auf Smartech Day by day und mit Genehmigung bei Dataconomy erneut veröffentlicht.
Sber hat ein großes Replace für seinen KI-Assistenten eingeführt GigaChatdas jetzt vom neuen Flaggschiffmodell GigaChat Extremely angetrieben wird. Die neue Model ermöglicht es dem KI-Assistenten, Fakten über Benutzer für eine personalisiertere Kommunikation und Lösungen zu speichern, selbstständig on-line nach Informationen zu suchen und Textantworten in der Hälfte der Zeit zu liefern.
Das neue Modell bietet Möglichkeiten sowohl für Endbenutzer als auch für Entwickler und ermöglicht es Entwicklern, angewandte KI-Produkte und -Dienste auf GigaChat Extremely zu entwickeln. Benutzer können Code in der Schnittstelle ausführen und anhand der aktuellen Dokumentation genaue Antworten zu ihren Fähigkeiten erhalten.
Anton Frolov, Senior Vice President, Leiter der generativen KI-Entwicklung, Sberbank:
„Wir machen einen Schritt von einem reinen Antworttool hin zu einem KI-Assistenten mit mehreren Agenten. Aber unser Ziel geht darüber hinaus: Wir schaffen eine Zukunft, in der traditionelle cellular Apps durch auf neuronalen Netzwerken basierende Schnittstellen ersetzt werden. Benötigte Funktionen werden auf Anfrage angezeigt und ermöglichen eine nahtlose Navigation durch die digitale Welt. GigaChat Extremely ist eines der weltweit größten Modelle, das vollständig in Russland entwickelt und trainiert wurde. Es merkt sich Ihre Präferenzen, arbeitet schneller, versteht Aufgaben besser und liefert qualitativ hochwertigere Empfehlungen. Das sind wir.“ Die letzten Grenzen zwischen Mensch und Maschine verschwinden.“
Langzeitgedächtnis
Eine Schlüsselinnovation liegt im Langzeitgedächtnis. Im Gegensatz zum Kontextgedächtnis (Kurzzeitgedächtnis), das nach jedem Gespräch zurückgesetzt wird, speichert GigaChat benutzerspezifische Fakten über Sitzungen hinweg und verwendet sie bei zukünftigen Interaktionen.
Hier ist, woran sich GigaChat genau erinnert:
- Hobbys, Geschmäcker und Interessen;
- Beruf, Ausbildung, Lebensziele und Gewohnheiten;
- personenbezogene Daten – nur in dem von den Nutzern selbst geteilten Umfang;
- Informationen über Familienmitglieder und Haustiere.
Das System identifiziert automatisch wichtige Fakten, ohne den Speicher mit Nebensächlichkeiten wie kurzfristigen Plänen oder weithin bekanntem Allgemeinwissen zu überlasten. Alle Daten werden in einem einheitlichen Profil gespeichert, das über die Sber-ID-Anmeldung zwischen Webversionen, mobilen Anwendungen und dem Telegram-Bot synchronisiert wird. Benutzer haben die volle Kontrolle über diese Funktion: Der Speicher kann jederzeit in den Einstellungen aktiviert oder deaktiviert werden.
Die Geschwindigkeit der Antwortgenerierung wurde verdoppelt
GigaChat generiert Textantworten doppelt so schnell wie das vorherige Flaggschiffmodell von Sber. Dies bedeutet, dass Benutzer Antworten quick sofort sehen, selbst bei komplexen Fragen, die eine detaillierte Begründung erfordern.
Diese Geschwindigkeitssteigerung wurde dank der Combination of Specialists (MoE)-Architektur erreicht. Das Modell agiert wie ein Group spezialisierter Experten, die jeweils spezifische Aufgaben erledigen. Nur relevante „Experten“ antworten auf eine bestimmte Anfrage und nicht das gesamte Modell arbeitet gleichzeitig.
Konversationsmodus in Echtzeit
GigaChat stellt jetzt automatisch eine Verbindung zu Internetsuchen nach Echtzeit-Updates her, sodass Benutzer diese Choice nicht mehr manuell aktivieren müssen. Dies gewährleistet genaue Antworten bei der Diskussion aktueller Nachrichten, Börsenkurse und anderer sich dynamisch ändernder Daten. Die Suchfunktion umfasst einen speziellen Umformulierer – ein System, das Benutzeranfragen neu formuliert, um die Relevanz zu erhöhen und die Qualität der endgültigen Antwort zu verbessern.
Der Sprachmodus unterstützt jetzt die On-line-Suche. Gespräche sind vollständig interaktiv: Benutzer können Themen sofort unterbrechen, klären oder ändern, ohne Verzögerung beim Kontextwechsel. Nach jeder Sitzung wird ein vollständiges Transkript gespeichert.
Selbstbewusstsein: GigaChat weiß alles über sich
In GigaChat wurde ein Selbsterkennungsmechanismus implementiert, der es dem Modell ermöglicht, korrekte Antworten zu seinen eigenen Eigenschaften zu geben. Bei der Beantwortung solcher Fragen bezieht sich das Modell auf eine aktuelle Dokumentation, in der die aktuelle Model, die unterstützten Funktionalitäten, Einschränkungen und Verhaltensauffälligkeiten beschrieben werden. Dies beseitigt typische Probleme, die bei Sprachmodellen häufig auftreten, wie z. B. die Bereitstellung falscher oder veralteter Informationen über ihre Fähigkeiten – beispielsweise die fälschliche Behauptung nicht vorhandener Funktionen oder die Nichterkennung vorhandener Funktionen.
Code-Interpreter: GigaChat als Analyseumgebung
Ein integrierter Code-Interpreter verwandelt GigaChat in eine isolierte Ausführungsumgebung für die Ausführung von Softwarecode direkt in der Benutzeroberfläche des Assistenten. Vor der Einführung dieser Funktion konnte das Modell lediglich Code schreiben und ihn den Benutzern anzeigen. Für die Ausführung und Prüfung der Ergebnisse sind externe Instruments erforderlich. Jetzt generiert GigaChat Code und führt ihn sofort in einer sicheren Sandbox aus, isoliert vom System des Benutzers.
Der Interpreter unterstützt hochgeladene Dateien, führt erweiterte numerische Berechnungen durch, validiert Datenstrukturen und erstellt Grafiken und Diagramme direkt in Chats. Dies macht GigaChat zu einem umfassenden Analysetool, das sich für Berichte, Tabellen und große Datensätze eignet.
Der Trainingsprozess
Die Ausbildung umfasste drei Stufen. Zunächst wurde der Wissensumfang um wissenschaftliche Bücher, Materialien zu Mathematik und Programmierung erweitert und die mehrsprachigen Datenmengen erhöht – mittlerweile sind es zehn Sprachen. In der Zwischenstufe wurden die Fachkenntnisse verbessert: Der Codekorpus wurde erweitert, zusätzliche Daten umfassten Physik, Medizin, Finanzen, Aufzeichnungen tatsächlicher Dialoge und Sicherheitsmaßnahmen wurden verstärkt. Die abschließende Feinabstimmung anhand von Beispielen (Editortexte, Dialoge, die Funktionen auslösen, Systemansagen) sorgte für eine stabile Efficiency unter realen Bedingungen.
Signifikante Verbesserungen wurden bei der Beantwortung offener und geschlossener Fragen sowie bei Aufgaben, die anspruchsvolles logisches Denken erfordern, verzeichnet. Benchmark-Exams für die Verwendung der russischen Sprache zeigten ein hohes Maß an grammatikalischer Korrektheit, natürlichem Sprachfluss, Lesbarkeit und strukturierten Antworten. Die Verbesserungen erstreckten sich auch auf praktische Branchenszenarien: Das Modell eignete sich besser für rechtliche, Cybersicherheits-, medizinische, finanzielle und handelsbezogene Aufgaben – insbesondere solche, die russischspezifische Nuancen und sektorale Terminologie betreffen. Bedeutende Fortschritte bei der mathematischen Berechnung und Codegenerierung haben seine Anwendbarkeit in den Bereichen Fintech, Bildung und Entwicklung erweitert.
Flaggschiffmodell wird öffentlich veröffentlicht
Sber macht den Quellcode und die Gewichte seines Flaggschiffmodells GigaChat Extremely frei zugänglich. Nach Einschätzung von Unternehmensexperten übertrifft es DeepSeek V3.1, Qwen3-235B und seinen Vorgänger GigaChat 2 Max bereits bei russischsprachigen Aufgaben, Mathematik und allgemeinem Denken. Durch die Veröffentlichung des Repositorys erhalten Organisationen, von großen Banken bis hin zu kleinen Startups, die Möglichkeit, das neuronale Netzwerk in ihren privaten Umgebungen zu installieren und an Unternehmensdaten anzupassen, was einen Schritt hin zu echter technologischer Souveränität darstellt.
Benutzer können das aktualisierte Modell kostenlos im testen WebversionAndroid-Apps verfügbar in RuStore Und AppGallerysowie in der Telegramm bot und MAX Messenger. Um den Sprachmodus und den Speicher zu aktivieren, melden Sie sich einfach über die Sber-ID an und aktivieren Sie die gewünschten Optionen in den Profileinstellungen.
