9. April 2026

Klassische RAG-Systeme stossen an ihre Grenzen, wenn Abfragen mehrere Datenmodalitaeten gleichzeitig erfordern. Ein Finanzanalyst, der fragt "Warum performen unsere europaeischen Operationen schlechter?", braucht sowohl SQL-Ergebnisse aus strukturierten Datenbanken als auch Kontext aus unstrukturierten Dokumenten wie Quartalsberichten oder internen Analysen. Standard-RAG bedient jeweils nur eine Modalitaet und liefert damit unvollstaendige oder halluzinierte Antworten. InfoQ beschreibt eine hierarchische Agentenarchitektur, die dieses Problem durch Aufgabenteilung und autonome Fehlerkorrektur adressiert.

Kernarchitektur: Supervisor-Worker-Topologie

Das System folgt einem Supervisor-Worker-Muster, das die sogenannte "Modality Gap" schliesst:

Der Supervisor verteilt die Arbeit nicht blind, sondern analysiert die Abfrage und routet gezielt an die passende Modalitaet. Bei der Beispielfrage wuerde ein SQL-Agent Umsatzdaten nach Region abfragen, waehrend ein Vektor-Agent relevante Abschnitte aus Strategiedokumenten oder Risikoberichten extrahiert.

Autonome Fehlerkorrektur: Reflective Retry

Das zentrale Differenzierungsmerkmal gegenueber flachen Agentensystemen ist der Umgang mit Fehlern. Statt fehlerhafte Ergebnisse weiterzureichen -- was in klassischen Systemen zu Halluzinationen fuehrt -- implementiert die Architektur einen dedizierten Retry-Knoten:

  1. Ein Worker-Agent schlaegt fehl (SQL-Syntaxfehler, Schema-Mismatch, leere Ergebnismenge)
  2. Der Fehlerkontext wird an einen Retry-Knoten uebergeben
  3. Der Retry-Knoten analysiert die Fehlerursache, schlaegt Korrekturen vor und validiert das Ergebnis vor der Rueckgabe
  4. Erst nach erfolgreicher Validierung fliesst das Ergebnis zurueck zum Supervisor

Dieser Mechanismus verhindert, dass das System bei Fehlern entweder halluziniert oder stumm unvollstaendige Antworten liefert.

Benchmarks

Die Evaluation erfolgte auf dem EntQA-Benchmark mit 200 Enterprise-Fragen, die strukturierte und unstrukturierte Datenquellen erfordern:

System Tier-3-Genauigkeit Halluzinationsrate p95-Latenz
Protocol-H (hierarchisch) 84,5% 7,1% 2,1s
Flat Agent 62,8% 18,2% 1,4s
Standard RAG 45,2% 28,5% 0,8s

Protocol-H erreicht gegenueber flachen Agenten eine Verbesserung von 21,7 Prozentpunkten bei der Genauigkeit und reduziert Halluzinationen um 60% gegenueber Standard-RAG. Der Preis dafuer ist eine hoehere Latenz -- 2,1 Sekunden gegenueber 0,8 Sekunden -- die aus der mehrstufigen Orchestrierung und den Validierungsschleifen resultiert.

Praxis-Relevanz

Fuer Teams, die agentenbasierte RAG-Systeme in Produktionsumgebungen betreiben, ergeben sich mehrere Implikationen:

Quellen

Nach oben