Cases

Was wir entwickeln und für wen wir beraten — Praxis statt PowerPoint.

Eigene Entwicklungen

Eigene KI-Systeme als Beweis: Wir wissen, wovon wir reden.

Mingly — Multi-LLM Desktop-App

Mingly bringt mehrere KI-Modelle (Claude, GPT, lokale Ollama-Modelle) in eine native Desktop-App auf macOS. Im Eigenbetrieb seit Anfang 2026, mit Fokus auf Datenschutz und Multi-Model-Routing.

ElectronReact 19TypeScriptTailwind

DocMind — RAG-Frontend für Privatdaten

DocMind ist eine Desktop-Anwendung, die private Dokumentensammlungen (PDFs, Notizen, Wikis) durchsuchbar macht — komplett offline, mit lokal laufenden Embeddings und Qdrant als Vektor-Store.

ElectronReactTypeScriptQdrant

RAG-Wissen — Production RAG für unsere eigene Wissensdatenbank

RAG-Wissen ist unser internes RAG-System für Beratungs-Wissen, technische Dokumentation und Markt-Intelligenz. Läuft produktiv mit Qdrant v1.17.1 und liefert die Recherche-Basis für unsere Blog-Artikel.

Python 3.13QdrantFastAPIMCP

Prüfstand — KI-Test-Framework

Prüfstand ist unser Framework für systematisches Testen von KI-Systemen — Prompt-Variationen, Modell-Vergleiche, Quality-Scoring durch LLM-as-a-Judge. Eingesetzt für die Qualitätssicherung unserer eigenen Produkte.

Electron GUIPython BackendVitestPytest

Nexbid — Agentic Ad Server

Nexbid ist eine Plattform für Agent Commerce: Werbung, die von KI-Agenten verstanden, bewertet und transaktiert werden kann. Live mit x402-Payment-Pilot, MCP-Server und AdCP 3.0 Trust-Surface.

TypeScriptNode.jsVercel FunctionsNeon Postgres

Compass — Research-Projekt

Compass ist ein internes Research-Projekt zur Untersuchung agentischer Workflows in komplexen Recherche-Aufgaben.

PythonClaude Agent SDKMCP

Eval-Framework — LLM-as-a-Judge

Unser Framework zur systematischen Evaluation von LLM-Outputs — mit Pairwise-Vergleichen, Bias-Korrekturen und Kalibrierung gegen Human-Baselines.

Python 3.13SQLitePydanticPrometheus2-Judge