title: Chinas KI-Offensive im Q1 2026 -- DeepSeek V4 und MiMo-V2-Pro date: 2026-04-02 summary: DeepSeek und Xiaomi zeigen mit Trillion-Parameter-Modellen, dass China trotz US-Sanktionen konkurrenzfaehig bleibt -- und Effizienz wichtiger wird als rohe Groesse. Update 3. April: DeepSeek V4 soll vollstaendig auf Huawei Ascend 950PR laufen, NVIDIA wird komplett ausgeschlossen tags: [deepseek, xiaomi, mimo, china, open-source, effizienz]

Chinas KI-Offensive im Q1 2026 -- DeepSeek V4 und MiMo-V2-Pro

Zwei Releases aus China haben im Maerz 2026 die KI-Landschaft aufgeruettelt: DeepSeek V4 und Xiaomis MiMo-V2-Pro. Beide Modelle erreichen die Trillion-Parameter-Marke, aktivieren aber pro Token nur einen Bruchteil davon. Das Muster ist klar -- Effizienz schlaegt rohe Groesse.

DeepSeek V4: Eine Billion Parameter auf chinesischer Hardware

DeepSeek V4 erschien Anfang Maerz 2026, strategisch getimt vor Chinas jaehrlichen "Two Sessions"-Parlamentssitzungen ab dem 4. Maerz. Das Modell ist ein Statement: Frontier-KI laesst sich auf chinesischer Hardware trainieren.

Architektur und Effizienz:

Rund 1 Billion (1T) Parameter gesamt, Mixture-of-Experts-Architektur (MoE)
Nur ca. 32B aktive Parameter pro Token (Top-16 MoE-Routing ueber 256+ Experten-Module)
Zum Vergleich: V3 hatte 671B Parameter gesamt bei 37B aktiven -- V4 ist also massiv groesser, aktiviert aber weniger pro Token
1M Token Context Window mit "Engram"-Speicherarchitektur (97% Accuracy bei Needle-in-a-Haystack-Tests)
Nativ multimodal: Text, Bild und Video in der Vortrainierungsphase integriert

Benchmark-Behauptungen (unabhaengig noch nicht verifiziert):

HumanEval: 90%
SWE-bench Verified: 80%+
Damit auf Augenhoehe mit Claude Opus 4.5/4.6 und GPT-5.2

Hardware-Wechsel als politisches Signal:

V3 wurde noch auf Nvidia H800 GPUs trainiert. V4 laeuft auf Huawei Ascend 910B und Cambricon MLU-Chips -- ausschliesslich chinesische Hardware. Reuters bestaetigte, dass Nvidia und AMD erstmals vom Pre-Release-Optimierungsprozess ausgeschlossen wurden. Das ist ein Bruch mit der bisherigen Praxis und ein direktes Signal an Washington: Die Sanktionen zwingen China zur Eigenstaendigkeit, aber sie stoppen die Entwicklung nicht.

Fuer Consumer-Hardware soll V4 in INT8-Quantisierung auf zwei RTX 4090 (48 GB VRAM gesamt) laufen, in INT4 auf einer einzelnen RTX 5090.

MiMo-V2-Pro: Das Stealth-Modell, das alle fuer DeepSeek V4 hielten

Am 11. Maerz 2026 tauchte auf OpenRouter ein anonymes Modell unter dem Codenamen "Hunter Alpha" auf. Innerhalb einer Woche kletterte es an die Spitze der taeglichen Nutzungscharts, verarbeitete ueber 1 Billion Tokens und loeste wilde Spekulationen aus -- die Community war ueberzeugt, es muesse sich um DeepSeek V4 handeln.

Am 18. Maerz enthuellte Xiaomis MiMo-Division: Hunter Alpha war MiMo-V2-Pro, das hauseigene Foundation Model.

Architektur:

1 Billion (1T) Parameter gesamt, MoE-Architektur
42B aktive Parameter pro Inference-Durchlauf (7:1 Hybrid-Ratio)
1M Token Context Window
Maximaler Output: 32K Tokens

Benchmarks:

Benchmark	MiMo-V2-Pro	Claude Opus 4.6	GPT-5.2 Codex
SWE-bench Verified	78.0%	80.8%	80.0%
Terminal-Bench 2.0	86.7	65.4	77.3
ClawEval	61.5	66.3	50.0

Besonders auffaellig: Bei Terminal-Bench 2.0 schlaegt MiMo-V2-Pro sowohl Opus als auch GPT deutlich. In SWE-bench und ClawEval liegt es knapp dahinter, aber in einer aehnlichen Gewichtsklasse.

Preisgestaltung:

Standard (bis 256K Context): 1 USD / 3 USD pro Million Tokens (Input/Output)
Extended (256K-1M): 2 USD / 6 USD pro Million Tokens
Zum Vergleich: Die gleiche Benchmark-Suite kostet bei MiMo-V2-Pro 348 USD, bei Opus 2.486 USD

Die aggressive Preispolitik ist Teil der Strategie: Xiaomi will Marktanteile ueber Volumen gewinnen.

Update 3. April: Ascend 950PR als Zielplattform

Neue Berichte von Anfang April verdichten das Bild rund um DeepSeeks Hardware-Strategie erheblich. Laut The Decoder soll DeepSeek V4 in den kommenden Wochen vollstaendig auf Huaweis neuem Ascend 950PR-Chip laufen -- einem Prozessor, der bisher noch nicht in grossem Massstab eingesetzt wurde.

Technische Einordnung des Ascend 950PR:

Der Ascend 950PR bietet gegenueber Huaweis bisherigem Spitzenmodell und NVIDIAs H20 -- dem derzeit fuer China-Export zugelassenen Chip -- einen signifikanten Leistungssprung. Berichten zufolge erreicht er ca. 2,8x hoehere Rechenleistung als das H20, bleibt aber unter dem Niveau von NVIDIAs H200. Fuer DeepSeek, das bereits bewiesen hat, besonders effizient mit verfuegbarer Hardware umzugehen, reicht das offenbar aus.

Entwicklungspartnerschaft und Marktsignal:

DeepSeek arbeitete monatelang gemeinsam mit Huawei und dem Chip-Designer Cambricon an der Portierung von V4 auf die neue Plattform. NVIDIA wurde von Entwicklungs- und Testphasen komplett ausgeschlossen -- eine Eskalation gegenueber der bereits gemeldeten Praxis bei V4s Training auf Ascend 910B.

Die Marktreaktion ist eindeutig: Alibaba, Bytedance und Tencent haben bereits hunderttausende Ascend-950PR-Einheiten vorbestellt. Diese massive Nachfrage hat die Chippreise um rund 20% in die Hoehe getrieben. Der chinesische Cloud-Markt setzt erkennbar auf die neue Hardware -- nicht als Notloesung, sondern als Primaerplattform.

Produktionsengpaesse als Bremse:

Trotz der Nachfrage kaempft Huawei weiterhin mit Produktionsengpaessen, die direkt auf US-Exportbeschraenkungen zurueckzufuehren sind. Der Zugang zu fortgeschrittener Chip-Fertigungstechnologie bleibt begrenzt, was die Skalierung der 950PR-Produktion verlangsamt. Das ist das bleibende Dilemma der chinesischen KI-Hardware-Strategie: Sie funktioniert, aber nicht so schnell, wie der Markt es gerade verlangt.

Einordnung: Effizienz als neues Paradigma

Beide Modelle zeigen denselben Trend: Die Gesamtgroesse eines Modells waechst, aber die Anzahl der aktiven Parameter pro Token bleibt konstant oder sinkt sogar. DeepSeek V4 aktiviert 32B von 1T Parametern (3,2%), MiMo-V2-Pro aktiviert 42B von 1T (4,2%). Das MoE-Prinzip erlaubt es, spezialisierte Experten-Subnetze nur bei Bedarf einzuschalten.

Das hat praktische Konsequenzen:

Inferenz-Kosten bleiben trotz wachsender Modellgroesse handhabbar
Latenz skaliert mit den aktiven, nicht den gesamten Parametern
Spezialisierung wird moeglich, weil verschiedene Experten fuer verschiedene Domaenen zustaendig sind

Fuer die geopolitische Dimension gilt: China demonstriert, dass US-Exportkontrollen die KI-Entwicklung verlangsamen, aber nicht stoppen. DeepSeeks Wechsel auf Huawei/Cambricon-Hardware ist der bisher deutlichste Beweis, dass Frontier-Modelle auch ohne Nvidia-GPUs trainiert werden koennen. Die Benchmark-Zahlen sind allerdings noch nicht unabhaengig verifiziert -- bis dahin bleiben sie mit Vorsicht zu geniessen.

Quellen

Nach oben