← Alle Cases

Compass — Research-Projekt

Compass ist unser internes Research-Projekt zur Untersuchung agentischer Workflows in komplexen Recherche-Aufgaben: mehrstufige Aufgaben, die ein Mensch über Tage hinweg bearbeiten würde, in einen orchestrierten Agenten-Ablauf übersetzen — mit Kontroll-Checkpoints, Quellen-Provenienz und auditierbarem Reasoning. Geschrieben in Python auf dem Claude Agent SDK, mit MCP-basierten Tool-Anbindungen an unsere internen Wissensquellen.

Python 3.13Claude Agent SDKMCPPydantic

Was Compass untersucht

Die offene Frage hinter agentischen Workflows lautet: wo bricht der Auto-Pilot? Ein Agent, der eine Stunde Recherche autonom durchläuft, erspart einen Tag Arbeit. Ein Agent, der nach vierzig Minuten in einen Halluzinations-Loop kippt, kostet einen Tag Aufräumarbeit plus Vertrauensschaden. Compass tested konkrete Recherche-Aufgaben (Marktstudien, Compliance-Recherchen, Anbieter-Vergleiche) mit unterschiedlichen Agenten-Architekturen — single-pass vs. Plan-Execute-Replan, mit und ohne Human-in-the-Loop-Checkpoints, mit verschiedenen Verifikations-Strategien.

Was wir bisher gelernt haben

Drei robuste Erkenntnisse aus dem Forschungsbetrieb. Erstens: Quellen-Provenienz ist nicht verhandelbar — jede Faktenaussage des Agenten muss auf ein konkretes Dokument zurückführbar sein, sonst ist das Ergebnis nicht prüfbar. Zweitens: Plan-Execute-Replan schlägt single-pass in fast jeder komplexen Aufgabe, aber die Plan-Qualität entscheidet alles. Drittens: gezielte Human-in-the-Loop-Checkpoints (typischerweise nach Planungsphase und vor Final-Synthese) erhöhen die Akzeptanz beim Auftraggeber deutlich, ohne die Effizienz spürbar zu reduzieren.

Praxis-Beweis für Agenten-Beratung

Compass ist absichtlich kein Produkt — es ist die Werkbank, auf der wir agentische Workflows ehrlich testen, bevor wir sie Kunden empfehlen. Daraus fliessen konkrete Empfehlungen in unsere Beratungs-Mandate: welche Aufgaben sind agenten-tauglich, welche nicht; wie sieht ein realistischer Kosten-Aufwand-Pfad aus; welche Verifikations-Mechanismen sind in der jeweiligen Branche regulatorisch notwendig. Auch hier: kein Marketing, sondern eigener Betrieb.