Die meisten KI-Instruments basieren auf dem Web und senden Ihre Eingabeaufforderungen zur Verarbeitung an Distant-Server, bevor sie Ergebnisse zurückgeben. Dieser Vorgang struggle für Benutzer immer unsichtbar. GOOGle ändert das mit Gemma 4! Bei richtiger Konfiguration läuft es direkt auf Ihrem Telefon, sodass keine ständige Verbindung erforderlich ist.
Mit einem einmaligen Obtain läuft alles lokal auf Ihrem Gerät und Ihre Daten bleiben vertraulich. Sie können über die Google AI Edge Gallery App darauf zugreifen. In diesem Artikel erfahren Sie, wie Sie die App verwenden und was Sie damit ohne Web erstellen können, sobald sie lokal auf Ihrem Gerät konfiguriert wurde.
Was genau ist Gemma 4?
Die Gemma 4-Familie besteht aus vier verschiedenen Modellen, die jeweils von Google für unterschiedliche Hardwareanforderungen optimiert wurden. Die E2B-Model ist ein ressourcenschonendes Gerät, während die E4B-Model für einen höheren Durchsatz konzipiert wurde. Die größeren Modelle sind wirklich beeindruckend; Beispielsweise belegt das dichte 31B-Modell den dritten Platz unter allen Open-Supply-Modellen weltweit, während das 26B-MoE-Modell auf Platz 5 liegt und viele größere Modelle übertrifft.

Obwohl diese Benchmarks bemerkenswert sind, gibt es noch viele andere Gründe, diese neue Era der künstlichen Intelligenz (KI) zu schätzen. Die gesamte Gemma 4-Familie wurde so konzipiert, dass sie Funktionen bietet, die über den einfachen Chat hinausgehen. Es wird in der Lage sein, komplexe Logik auszuführen und Agenten-Workflows zu erleichtern, Wörter, Movies und Audio zu verarbeiten und mehr als 140 verschiedene Sprachen zu verwenden.
Für Geräte wie Telefone wurden die beiden Edge-Varianten von Gemma 4 (E2B und E4B) speziell für ressourcenarme {Hardware} entwickelt. Diese Modelle können Bild-, Audio- und Textdaten verarbeiten; Funktionsaufrufe einschließen; und klein genug sein, um den Speicherbeschränkungen mobiler Plattformen gerecht zu werden.
Mehr lesen: Gemma 4 von Google: Arms-On
Die App, die es möglich macht
Google hat seine AI Edge Gallery-Anwendung veröffentlicht, die sowohl auf Android- als auch auf iOS-Plattformen funktioniert. Ihr Smartphone erledigt alle Verarbeitungsaufgaben, ohne dass ein Cloud-Dienst erforderlich ist. Die Anwendung fungiert als Open-Supply-Software program.
Die folgenden Funktionen der AI Edge Gallery machen sie für unseren Anwendungsfall unverzichtbar:
- KI-Chat mit Denkmodus: Das Modell demonstriert seinen Argumentationsprozess, indem es Ihre Frage über den gesamten Argumentationspfad erläutert
- Bild fragen: Sie können mit Ihrer Kamera jedes Objekt scannen, das Sie untersuchen möchten, und Fragen dazu stellen.
- Audioschreiber: Das Instrument ermöglicht es Benutzern, gesprochenes Audio in Textual content oder verschiedene Sprachen umzuwandeln, ohne dass eine Internetverbindung erforderlich ist.
- Agentenfähigkeiten: Das System kann mehrere Aufgaben ohne menschliche Anleitung ausführen, indem es Ressourcen wie Wikipedia nutzt.
- Immediate-Lab: Benutzer können ihre Eingabeaufforderungen auswerten, indem sie die Temperatureinstellungen steuern, um ihre Ergebnisse zu verbessern.
Die Agent Abilities-Funktion ist ein wesentliches Aspect des Techniques. Dies ist einer der ersten Fälle, in denen Verbraucher eine mehrstufige Agenten-KI-Technologie nutzen können, die vollständig offline auf ihren Mobilgeräten funktioniert.
Warum ist das eigentlich wichtig?
Die Möglichkeit, KI auf lokalen Systemen auszuführen, bietet zahlreiche Vorteile, die über den ästhetischen Reiz hinausgehen. Die drei Hauptvorteile dieser Technologie bieten den Benutzern echte Vorteile:
- Das Modell läuft vollständig auf Ihrem Gerät, wodurch die Privatsphäre zur Hauptanforderung wird. Die Anwendung überträgt keine Ihrer freigegebenen Inhalte, einschließlich Eingabeaufforderungen und Antworten sowie Bilder, an Google oder einen anderen Server. Das System funktioniert über seine Netzwerkverbindung, sodass lediglich das Modell heruntergeladen werden muss.
- Keine Konnektivität erforderlich. Das System funktioniert einwandfrei, wenn Sie sich auf einem Flug, in einem Keller oder in einem Bereich mit schwachem Sign befinden. Gemma 4 funktioniert unabhängig von Ihrem aktuellen Standort. Die Software program bietet nach dem Herunterladen den vollständigen Funktionsumfang.
- Das Modell ist nach Abschluss des Downloads auf unbestimmte Zeit frei nutzbar. Es funktioniert ohne den Einsatz von Hintergrundressourcen, da keine Token, Guthaben oder Abonnements erforderlich sind.
Der Lizenzvertrag legt eine weitere Anforderung fest. Google hat Gemma 4 unter einer Apache 2.0-Lizenz veröffentlicht, die es Unternehmen ermöglicht, die Modelle ohne Nutzungsbeschränkungen zu verwenden, zu ändern und darauf aufzubauen.

Welches Modell sollten Sie wählen?
Die meisten Menschen sind an diesem Punkt verwirrt. Die Größe eines Modells bestimmt nicht seinen Wert, da größere Modelle kleinere nicht immer übertreffen. Zu den vier Varianten von Gemma 4 gehören Efficient 2B (E2B) und Efficient 4B (E4B) sowie 26B Combination of Consultants und 31B Dense. Für Telefone müssen Sie laut Enterprise At the moment die Systeme E2B und E4B verwenden.
Im Folgenden finden Sie einen wesentlichen Überblick:
- Gemma 4 E2B benötigt zum Betrieb weniger als 1,5 GB RAM. Das System bietet sofortige Antworten auf einfache Anfragen und generiert durch seine Fragen und Antworten kurze Zusammenfassungen.
- Gemma 4 E4B benötigt für seinen Betrieb etwa 2,5 GB RAM. Das System kann durch seine verbesserten Denkfähigkeiten und sein verbessertes Funktionsaufrufsystem komplexere visuelle Aufgaben ausführen.
Das E2B-System bietet eine bessere Leistung als andere Systeme für grundlegende Vorgänge, die einen hohen Leistungsbedarf aufweisen. Das E4B-System bietet eine bessere Leistung als andere Systeme, da es komplexe Funktionsschemata und mehrere Funktionsoptionen besser verarbeitet als andere Systeme.

Sie sollten mit E2B als Ausgangspunkt beginnen. Wechseln Sie zu E4B, wenn Sie feststellen, dass die Lösung mehrstufige Argumentationsaufgaben nicht bewältigen kann.
Erste Schritte mit Gemma 4
Schritt 1: Gehen Sie zum Google Play Retailer (für Android) oder Apple Retailer (für iOS) und geben Sie ein Google AI Edge-Galerie und laden Sie die App herunter.
Schritt 2: Öffnen Sie die App. Sie werden zum Hauptmenü weitergeleitet und sehen alle fünf Modi, aus denen Sie wählen können (KI-Chat, Fragen Sie nach einem Bild, Audioschreiber, Agentenfähigkeiten, Und Immediate Lab).
Schritt 3: Navigieren Sie zum Abschnitt „Modellverwaltung“ und laden Sie entweder Gemma 4 E2B oder Gemma 4 E4B herunter. Sie müssen nur dann mit dem Web verbunden sein, wenn Sie diese Modelle herunterladen. Sie müssen dies nur einmal tun.
Schritt 4: Nach dem Herunterladen können Sie den Flugmodus aktivieren. Ab diesem Zeitpunkt funktionieren alle Funktionen auch ohne Internetverbindung.
Aufgabe 1: Erstellen eines Sudoku-Spiels mit der KI-Chat-Funktion
Hier entwickeln wir das Sudoku-Spiel mit Gemma 4 in der Google AI Edge Gallery, indem wir die AI Chat-Funktion auswählen:
- Öffnen Sie zunächst die App, wählen Sie AI Chat aus und aktivieren Sie ihn dann Denkmodus.
- Geben Sie ein: „Bitte erstellen Sie ein Sudoku-Spiel mit HTML-CSS-Javascript, um einen Timer zu haben, die Lösungsfunktionen zu überprüfen und sicherzustellen, dass es für Mobilgeräte geeignet ist“ (keine Anführungszeichen).
- Das Modell führt seine Logik aus, bevor es den vollständigen Code erzeugt.
- Wenn Sie fertig sind, kopieren Sie einfach den gesamten Code und fügen Sie ihn in eine neue Textdatei ein, die als HTML-Datei gespeichert wird. Öffnen Sie dann die neue HTML-Datei mit einem beliebigen Webbrowser. Ihr Spiel sollte jetzt funktionieren.
Notiz: Wenn Sie von Anfang an einen saubereren Code wünschen, versuchen Sie es mit Gemma 4 E4B. Sollten Probleme mit Funktionen auftreten, die zuvor ordnungsgemäß funktioniert haben, teilen Sie Gemma einfach mit, mit welcher Funktion Sie Probleme haben, und bitten Sie sie um Hilfe bei der Reparatur.
Rezensionsanalyse:
Als ich das E2B-Modell aufforderte, stoppte es einfach mitten in der Aufgabe, aber nach der Aufforderung zum E4B-Modell wurde die Ausgabe erzeugt. Das Modell gab uns eine HTML-Codedatei mit ausführlichen Anweisungen, die für technisch nicht versierte Benutzer sehr hilfreich struggle. Allerdings hätte es uns auch eine Frontend-Schnittstelle zeigen können, was etwas enttäuschend struggle. Da es im Offline-Modus läuft, nimmt es außerdem viel Zeit in Anspruch, was uns die Grenzen des Modells zeigt.
Aufgabe 2: Aufgaben mit Agentenfähigkeiten automatisieren
- Aktivieren Sie die Fähigkeiten „Karte“, „E-Mail“ und „Wikipedia“, indem Sie auf „Agentenfähigkeiten“ tippen und sie aktivieren.
- Anschließend können Sie den Agenten testen, indem Sie ihm nacheinander die folgenden drei Aufforderungen stellen:
- „Suchen Sie ein Café in meiner Nähe und platzieren Sie es für mich auf einer Karte.“
- „Verfassen Sie eine E-Mail, die ich an John senden soll, in der Sie angeben, dass ich 10 Minuten zu spät komme, und senden Sie sie ab.“
- Nach jeder Anfrage zerlegt der Agent die Anfrage in einzelne Aufgaben, ruft das/die entsprechende(n) Instrument(s) auf und bestätigt dies mit Ihnen, bevor er die Arbeit abschließt und versendet.
Notiz: Sie können nach jedem Schritt genau nachvollziehen, welche Fähigkeiten der Agent eingesetzt hat. Der Makler ist auch in seinem Handeln Ihnen gegenüber völlig clear.
Rezensionsanalyse:
Die Ergebnisse waren für mehrere Agentenfähigkeitstypen etwas unterschiedlich. Bei der ersten Abfrage lieferte Map im Allgemeinen Ergebnisse, bei denen der Standort auf der Karte korrekt aussah, aber es hätte in der Lage sein sollen, meinen Standort selbst zu erkennen, anstatt mich explizit zu fragen.
Bei der zweiten Abfrage wurde der Ability für „E-Mail senden“ entsprechend geladen. Nach der Ausführung des Abilities wurde angezeigt, dass die Nachricht gesendet wurde, aber es gab keine Informationen darüber, wohin die Nachricht gesendet wurde, was ein großer Nachteil ist. Die Reaktionszeit und gelegentliche Ausfälle bei der Erledigung der Aufgabe zeigten, dass beim Einsatz von Geräten vom Typ „Agentische KI“ noch erheblicher Verbesserungsbedarf besteht.
Was kann es (noch) nicht?
Wenn wir über Gemma 4 sprechen, gibt es auch einige Einschränkungen:
- Mit der Verwendung von Inferenz ist ein Batterieverbrauch verbunden, da sie deutlich mehr Computerleistung erfordert als andere Arten von Apps. Daher wird Ihr Akku viel schneller entladen als bei anderen Arten von Apps. Geräte mit dedizierten NPUs können den Batterieverbrauch der Inferenz viel besser verwalten, als wenn sie nur die CPU für die Inferenz verwenden. Beispielsweise wird der Akku eines Pixel 9 Professional mit Gemma 4 4B viel langsamer entladen, als wenn nur eine reine CPU verwendet wird.
- Darüber hinaus können die größeren Versionen von Gemma (26B und 31B) nicht auf einem Mobiltelefon verwendet werden; Sie benötigen einen Laptop computer mit viel RAM, um sie auszuführen. Die E2B- und E4B-Geräte eignen sich intestine für alltägliche Aufgaben; Allerdings werden sie in naher Zukunft keine Frontier-Cloud-Modelle ersetzen.
- Schließlich verfügen die Edge-Modelle über ein 128 KB großes Kontextfenster, was intestine ist; Da Telefone jedoch nicht über so viel Speicher verfügen wie Pc, müssen Sie Ihre Gespräche auf einem Telefon relativ kurz halten.
Abschluss
Der Begriff „KI auf Ihrem Telefon“ wird seit mehreren Jahren als grundlegende Schnittstelle beschrieben, die auf Distant-Cloud-APIs zugreift. Das System verarbeitete Ihre Informationen über einen Umweg, der über einen ungeschützten Server führte.
Gemma 4 richtet eine ein völlig neue Verbindung zwischen zwei verschiedenen Einheiten.
Ihr aktuelles Taschengerät kann drei Funktionen ausführen, darunter das Transkribieren von Vorträgen, das Analysieren visueller Inhalte und das Lösen schwieriger Herausforderungen durch Offline-Funktionen. Bisher struggle für den Systembetrieb eine komplette Serveranlage erforderlich. Jetzt ist ein App-Obtain erforderlich.
Die Ära der KI, die lautlos auf Ihrem Taschengerät läuft, ohne dass ein Server beteiligt ist, ist keine Forschungsdemonstration mehr.
Häufig gestellte Fragen
A. Gemma 4 läuft direkt auf Ihrem Telefon und verarbeitet Eingabeaufforderungen nach einem einmaligen Obtain lokal, ohne Daten an externe Server zu senden.
A. Verwenden Sie E2B für grundlegende Aufgaben mit wenig RAM und E4B für komplexere Überlegungen und erweiterte Funktionen auf Mobilgeräten.
A. Es gewährleistet Privatsphäre, funktioniert ohne Web und vermeidet laufende Kosten wie Abonnements, Token oder Cloud-Nutzungsgebühren.
Melden Sie sich an, um weiterzulesen und von Experten kuratierte Inhalte zu genießen.
