7. April 2026

Strukturierte Extraktion aus langen Dokumenten -- Rechnungen, Kontoauszüge, Verträge -- scheitert bei klassischen Single-Pass-Ansätzen an einem grundlegenden Problem: Es gibt keinen eingebauten Mechanismus, der die Ausgabe auf Korrektheit prüft. Fehler werden erst downstream entdeckt, oft erst durch menschliche Reviewer.

Reducto adressiert das mit Deep Extract: einem Agenten-System, das seine eigene Extraktion in einer autonomen Verifikationsschleife überprüft und bei Abweichungen korrigiert -- ohne menschlichen Eingriff. Das Modell extrahiert, bewertet die Ausgabe gegen interne Kriterien und iteriert, bis die Konfidenz ausreicht.

In der Beta wurden 28 Millionen Felder aus Dokumenten bis zu 2.500 Seiten Länge verarbeitet. Laut Reducto erreicht das System 99 bis 100 Prozent Feldgenauigkeit -- und übertrifft dabei menschliche Labeler. Die Zahlen kommen von Reducto selbst und sollten mit eigenen Stichproben verifiziert werden, aber die Größenordnung ist bemerkenswert.

Für Teams, die Dokumentenverarbeitung in Workflows einbetten -- etwa für Buchhaltung, Compliance oder Datenerfassung -- ist der Ansatz praktisch relevant: weniger Nachbearbeitung, weniger Ausnahmebehandlung in der Nachverarbeitung.

Quellen

Nach oben