2. April 2026

Gemma 4: Googles leistungsfaehigste offene Modellfamilie jetzt unter Apache 2.0

Google DeepMind hat mit Gemma 4 die bisher leistungsfaehigste offene Modellfamilie des Unternehmens veroeffentlicht. Der wichtigste Wechsel: Erstmals steht Gemma unter der Apache 2.0 Lizenz statt der bisherigen proprietaeren Gemma-Lizenz. Das beseitigt Einschraenkungen fuer kommerzielle Nutzung und Weiterentwicklung.

Vier Modelle, unterschiedliche Architekturen

Die Familie umfasst vier Modelle mit verschiedenen Groessen und Ansaetzen:

Gemma E2B und E4B nutzen Per-Layer Embeddings (PLE), eine neue Architektur-Entscheidung: Jeder Decoder-Layer bekommt eigene Token-Embeddings. Die Lookup-Tabellen sind zwar gross, fuehren aber nur schnelle Lookups durch -- das ergibt hohe Effizienz bei kleiner Modellgroesse.
Gemma 26B MoE ist ein Mixture-of-Experts-Modell, das nur 3.8B Parameter pro Inference-Schritt aktiviert. Das senkt den Rechenaufwand drastisch gegenueber einem vergleichbar grossen Dense-Modell.
Gemma 31B Dense ist das groesste Modell der Familie mit klassischer dichter Architektur.

Alle vier Modelle sind vision-faehig und fuer Reasoning optimiert. Google spricht von "unprecedented intelligence-per-parameter".

Lokale Ausfuehrung im Fokus

Gemma 4 ist explizit fuer lokale Ausfuehrung ausgelegt. Das 26B MoE und das 31B Dense passen jeweils auf eine einzelne 80GB H100. In quantisierten Varianten laufen sie auf Consumer-GPUs. NVIDIA hat zeitgleich Optimierungen fuer RTX GPUs angekuendigt.

Fuer die groesseren Modelle bietet Google API-Zugang ueber AI Studio an -- aber der Fokus liegt klar auf Self-Hosting.

Einordnung

Der Wechsel zu Apache 2.0 ist strategisch bedeutsam. Google oeffnet damit den Wettbewerb mit Metas Llama und Alibabas Qwen auf der Lizenzebene vollstaendig. Die PLE-Architektur bei den kleineren Modellen und der MoE-Ansatz beim 26B zeigen, dass Google verschiedene Effizienzstrategien parallel verfolgt, statt auf eine einzige Architektur zu setzen.

Quellen

Gemma 4 -- Google DeepMind
Gemma 4 -- Simon Willison
Google's Gemma 4 is now available with Apache 2.0 licensing for the first time -- The Decoder
Google announces Gemma 4 open AI models, switches to Apache 2.0 license -- Ars Technica
Gemma 4 -- Google Blog
RTX AI Garage: Open Models with Google Gemma 4 -- NVIDIA Blog

Nach oben