7. April 2026

Gemma 4: Zwei Millionen Downloads und die Local-First-Welle

Googles Gemma 4 hat in seiner ersten Woche rund zwei Millionen Downloads erreicht. Zum Vergleich: Gemma 3 benötigte dafür ein ganzes Jahr und landete bei 6,7 Millionen. Das Wachstumstempo ist ein deutliches Signal für den Bedeutungszuwachs lokaler Modelle.

Der praktische Treiber ist die Hardware-Kompatibilität. Gemma 4 läuft auf Consumer-Geräten – auf einem iPhone 17 Pro werden via MLX rund 40 Tokens pro Sekunde erreicht. Ollama, vLLM, llama.cpp und Cloudflare unterstützen das Modell bereits, was die Einstiegshürde für lokale Deployments weiter senkt. Google liefert mit der AI Edge Gallery ein Begleit-Tool für den einfachen Einstieg.

In der Community wächst die Diskussion, ob Gemma 4 im lokalen Betrieb Cloud-Abonnements wie Claude für bestimmte Anwendungsfälle ersetzen kann. Die Argumente: keine Latenz durch Netzwerk, keine Datenweitergabe, keine monatlichen Kosten. Die Einschränkungen – Modellgröße, Kontextfenster, Spezialisierung – bleiben, sind aber für viele Alltagsaufgaben irrelevant.

Gemma 4 ist kein Frontier-Modell, aber es macht die Local-First-Option für einen breiteren Nutzerkreis praktikabel.

Quellen

Nach oben