Spec Layer und TCR: Neue Qualitaetskontrolle fuer AI-generierten Code
Das Problem: Technisch korrekt, inhaltlich falsch
AI-Agents liefern Code, der kompiliert und Tests besteht -- und trotzdem am Ziel vorbeigeht. Matt Rickard nennt das "the wrong kind of correct". Die gaengigen Qualitaetswerkzeuge der Software-Entwicklung (Compiler, Linter, Unit Tests) wurden fuer die typischen Fehler von Menschen gebaut: Syntaxfehler, Typfehler, vergessene Edge Cases. AI-Agents machen andere Fehler. Sie produzieren formal korrekten Code, der die eigentliche Intention nicht trifft.
Rickards Spec Layer
Rickard schlaegt eine neue Schicht vor: die "Spec Layer". Gemeint sind formale Spezifikationen, die nicht nur das Verhalten, sondern die Intention kodieren. Tests pruefen, ob Code das Richtige tut. Spezifikationen pruefen, ob Code das Gemeinte tut. Der Unterschied klingt subtil, wird aber entscheidend, wenn der Implementierer kein Mensch mehr ist, der implizites Kontextwissen mitbringt. Ohne explizite Spezifikationen fehlt dem Agent die Information, die ein menschlicher Entwickler aus Gespraechen, Domain-Wissen und Erfahrung ableitet.
Becks TCR fuer Agents
Kent Beck verfolgt einen anderen Hebel: haertere Feedback-Loops. Er experimentiert mit TCR (Test && Commit || Revert) fuer AI-Agents. Das Prinzip ist radikal einfach: Bestehen die Tests, wird der Code automatisch committet. Schlagen sie fehl, wird alles verworfen und der Agent startet von vorn. Kein Debuggen, kein Nachbessern -- nur bestehen oder verwerfen. Fuer menschliche Entwickler war TCR immer eine Nische. Fuer AI-Agents, die billig und schnell neu generieren koennen, wird es zu einem ernsthaften Qualitaetsfilter.
Einordnung
Beide Ansaetze adressieren dasselbe Grundproblem, setzen aber an verschiedenen Stellen an. Rickard will die Spezifikation schaerfen -- dem Agent bessere Vorgaben geben, damit er die Intention ueberhaupt treffen kann. Beck will den Filter verschaerfen -- schlechte Ergebnisse sofort verwerfen statt reparieren. Zusammen ergibt sich ein klares Bild: Tests allein sind als Qualitaetskontrolle nicht mehr ausreichend, wenn der Implementierer ein Agent ist. Wir brauchen sowohl praezisere Eingaben (Specs) als auch kompromisslosere Rueckkopplungen (TCR).