8. April 2026

Google AI Edge Eloquent -- Offline-Diktat mit On-Device Gemma

Google hat Anfang April 2026 ohne grosse Ankuendigung eine Diktier-App im iOS App Store veroeffentlicht: AI Edge Eloquent. Das Besondere ist nicht die Funktion selbst -- Sprache-zu-Text gibt es seit Jahren -- sondern die Architektur: Die App laeuft vollstaendig offline auf dem Geraet.

Funktionsumfang

Die App transkribiert gesprochene Sprache in Echtzeit mit Wellenform-Visualisierung. Nach dem Pausieren bereinigt sie den Text automatisch:

Die App ist kostenlos, ohne Abo und ohne Nutzungslimit.

Technische Architektur: Was Offline-First bedeutet

AI Edge Eloquent bietet zwei Modi:

Offline-Modus: Die gesamte Spracherkennung laeuft ueber ein Gemma-basiertes ASR-Modell (Automatic Speech Recognition) lokal auf dem Geraet. Kein Audio verlaesst das Telefon. Die Textbereinigung passiert ebenfalls on-device. Das ist relevant fuer alle, die vertrauliche Inhalte diktieren -- Arztbriefe, Vertraege, interne Notizen.

Cloud-Modus: Die Spracherkennung startet weiterhin lokal, aber die Textbereinigung und Reformatierung uebernehmen Gemini-Modelle in der Cloud. Bessere Ergebnisse, aber mit Datenuebertragung.

Die technisch interessante Frage ist, wie Google ein ASR-Modell der Gemma-Familie auf ein Mobilgeraet bringt. Gemma 2B hat 2 Milliarden Parameter -- das laeuft auf einem aktuellen iPhone, ist aber kein Selbstlaeufer. Die genaue Modellvariante hat Google nicht kommuniziert.

Plattformen

Einordnung

Offline-First AI auf Mobilgeraeten ist ein Trend, der gerade Fahrt aufnimmt. Apple baut mit Apple Intelligence seit 2024 daran, Google kontert jetzt mit einer eigenstaendigen App statt einer OS-Integration. Der Ansatz ist pragmatisch: Statt auf Android 16 zu warten, liefert Google eine App fuer die Plattform, auf der die kaufkraeftigste Zielgruppe sitzt -- iOS.

Fuer den Coding-Alltag ist die App in einem konkreten Szenario nuetzlich: Gedanken, Architekturideen oder Bug-Beschreibungen unterwegs diktieren und spaeter als bereinigten Text weiterverarbeiten. Die Filler-Wort-Bereinigung macht den Output direkt brauchbar, ohne manuelles Editieren.

Der technische Unterbau -- Gemma-Modelle auf dem Geraet -- zeigt, wohin die Reise geht: Kleine, spezialisierte Modelle fuer klar umrissene Aufgaben, die keine Cloud brauchen. Das ist das Gegenmodell zu den immer groesseren Foundation Models.

Quellen

Nach oben