PaperOrchestra: Googles Multi-Agent-Framework fuer automatisierte Forschungsarbeiten

9. April 2026

Google Cloud AI Research hat mit PaperOrchestra ein Multi-Agent-Framework vorgestellt, das unstrukturierte Forschungsmaterialien -- Ideenskizzen und experimentelle Logdateien -- in einreichungsfertige LaTeX-Manuskripte umwandelt. Das System adressiert eine Luecke in der AI-gestuetzten Forschung: Waehrend es bereits Systeme fuer Experiment-Automatisierung gibt, war die Synthese von Rohmaterialien zu strukturierten Manuskripten bisher kaum erforscht.

Architektur

PaperOrchestra zerlegt den Schreibprozess in spezialisierte Agenten, die parallel arbeiten und iterativ reflektieren:

Outline Agent: Synthetisiert Eingaben zu einem strukturierten Plan
Plotting Agent: Generiert konzeptionelle Diagramme und statistische Plots
Literature Review Agent: Fuehrt gezielte Web-Suchen durch und verifiziert gefundene Paper ueber die Semantic Scholar API, um einen robusten Zitationsgraphen aufzubauen
Section Writing Agent: Verfasst das vollstaendige LaTeX-Manuskript
Content Refinement Agent: Optimiert den Entwurf iterativ auf Basis simulierter Peer-Review-Kritik

Die API-gestuetzte Zitationsvalidierung ist dabei ein zentraler Unterschied zu bestehenden Ansaetzen: Statt Zitate zu halluzinieren, prueft das System deren Existenz und Relevanz programmatisch.

PaperWritingBench

Zur Evaluation stellen die Autoren PaperWritingBench vor -- den ersten standardisierten Benchmark fuer AI-Schreibsysteme. Der Datensatz besteht aus 200 reverse-engineerten Rohmaterialien von Top-Konferenz-Papern (je 100 von CVPR 2025 und ICLR 2025). Die Eingaben bestehen aus einer Ideenzusammenfassung und einem experimentellen Logbuch, das numerische Daten aus Tabellen und Beobachtungen aus Abbildungen enthaelt.

Ergebnisse

In Side-by-Side-Evaluationen mit 11 AI-Forschern wurde PaperOrchestra gegen einen Single-Agent-Ansatz und AI Scientist-v2 verglichen:

Literaturuebersicht: 50-68% absolute Gewinnrate gegenueber den Baselines
Gesamtqualitaet des Manuskripts: 14-38% Vorsprung
Gegenueber menschlichen Autoren: Eine Qualitaetsluecke besteht weiterhin -- das System ersetzt keine Forscher

Einordnung

Die Autoren positionieren PaperOrchestra ausdruecklich als Assistenz-Werkzeug, nicht als autonomen Autor. Forscher sollen weiterhin fuer Faktengenauigkeit, Originalitaet und Validitaet verantwortlich bleiben. Die API-gestuetzte Zitationsvalidierung mindert Halluzinationen, ersetzt aber keine menschliche Pruefung.

Fuer die Praxis ist PaperOrchestra relevant als Indikator, wohin sich AI-gestuetztes wissenschaftliches Schreiben entwickelt: Weg von monolithischen Prompts, hin zu spezialisierten Agent-Pipelines mit externen Werkzeugen. Die Trennung in Recherche, Strukturierung, Schreiben und Review spiegelt den tatsaechlichen menschlichen Arbeitsprozess wider.

Quellen

Nach oben