RAG-Wissen — Production RAG für unsere eigene Wissensdatenbank
RAG-Wissen ist unser internes RAG-System für Beratungs-Wissen, technische Dokumentation und Markt-Intelligenz. Läuft produktiv mit Qdrant v1.17.1 und liefert die Recherche-Basis für unsere Blog-Artikel.
Python 3.13QdrantFastAPIMCPHarrier-Embeddings
Embedding-Modell-Wahl
Wir haben fünf Embedding-Modelle für deutschsprachige Inhalte benchmarkt. Harrier hat gewonnen mit +50% gegenüber mxbai und +12% gegenüber Qwen3. Resultat: produktiver Einsatz seit April 2026.
Was wir daraus lernen
Embedding-Modell-Auswahl ist nicht trivial — Standard-Empfehlungen für englische Inhalte funktionieren oft schlecht für deutsche Texte. Wir bringen diese Benchmark-Erfahrung in jeden RAG-Strategie-Workshop ein.