Das Team von Rival Tips hat 178 KI-Modelle systematisch anhand ihres Schreibstils analysiert und dabei ueberraschende Aehnlichkeiten aufgedeckt. Die zentrale Erkenntnis: 9 distinkte Klon-Cluster existieren, in denen Modelle eine Kosinus-Aehnlichkeit von ueber 90% aufweisen -- teilweise von unterschiedlichen Anbietern und mit drastisch unterschiedlichen Preisen.
Methodik
Die Analyse basiert auf 3.095 standardisierten Antworten, die ueber 43 speziell entworfene Prompts generiert wurden. Aus jeder Antwort extrahierten die Forscher einen 32-dimensionalen stilometrischen Fingerabdruck, der folgende Merkmale erfasst:
- Lexikalischer Reichtum: Vokabularvielfalt, Wortfrequenzen
- Satzstruktur: Satzlaenge, Komplexitaet, Varianz
- Interpunktion: Nutzungsmuster von Satzzeichen, Klammern, Doppelpunkten
- Formatierung: Einsatz von Listen, Ueberschriften, Codeblocks
- Diskursmarker: Uebergangsphrasen, Hedging-Ausdruecke, rhetorische Muster
Die Aehnlichkeitsberechnung erfolgte ueber Kosinus-Aehnlichkeit auf z-normalisierten Merkmalsvektoren, was Skalenunterschiede zwischen den Dimensionen ausgleicht.
Zentrale Ergebnisse
9 Klon-Cluster (>90% Aehnlichkeit): Modelle innerhalb dieser Cluster schreiben praktisch identisch. Das betrifft nicht nur Varianten desselben Anbieters, sondern auch Modelle verschiedener Hersteller.
Cross-Provider-Zwillinge: Einige Modelle unterschiedlicher Anbieter erzeugen nahezu identische Texte. Das deutet auf gemeinsame Trainingsdaten, Distillation oder aehnliche Feinabstimmungsprozesse hin.
Preisunterschiede bei identischem Output: In einzelnen Faellen schreiben Modelle identisch, kosten aber bis zu 185-mal mehr. Fuer Anwender die stilistische Konsistenz nicht benoetigen, ergeben sich hier erhebliche Einsparpotenziale.
Mistral-Befund: Mistral Large 2 und Large 3 2512 erreichen 84,8% auf einem zusammengesetzten Aehnlichkeitsmass -- eine hohe, aber nicht vollstaendige Uebereinstimmung zwischen den Generationen.
Relevanz fuer die Praxis
Die Studie hat mehrere praktische Implikationen:
- Modellauswahl: Wer zwischen Modellen mit aehnlichem Fingerabdruck waehlt, kann oft das guenstigere nehmen, ohne stilistische Einbussen zu befuerchten. Die Cluster-Zuordnung macht verborgene Redundanzen sichtbar.
- AI-Erkennung: Stilometrische Fingerabdruecke koennten die Zuordnung von Texten zu spezifischen Modellen ermoeglichen -- relevant fuer akademische Integritaet und Content-Authentifizierung.
- Synthetische Daten: Wenn Modelle innerhalb eines Clusters identisch schreiben, verstaerkt Training auf ihren Ausgaben die stilistische Monokultur. Diversitaet in Trainingsdaten erfordert bewusste Auswahl stilistisch unterschiedlicher Quellmodelle.
- Transparenz: Die Analyse legt offen, dass manche als eigenstaendig vermarkteten Modelle moeglicherweise auf denselben Basismodellen oder Trainingspipelines beruhen.
Einschraenkungen
Die Analyse erfasst nur den Schreibstil, nicht die inhaltliche Qualitaet, Faktentreue oder Reasoning-Faehigkeit der Modelle. Hohe stilistische Aehnlichkeit bedeutet nicht zwingend identische Leistung bei Aufgaben wie Code-Generierung oder mathematischem Reasoning.