31. März 2025
Fachartikel: Technische Tiefenschau - Wie Google AI Overviews Inhalte findet, bewertet und generiert
Google AI Overviews basieren auf einem RAG-System mit Gemini. Technische Analyse der Pipeline: Crawling, Retrieval, Re-Ranking, LLM Reasoning und Output-Assembly.
1. Einordnung: Von klassischen Ergebnissen zu AI Overviews
AI Overviews (AIO) sind ein Retrieval-Augmented-Generation-System (RAG): Klassische Suchsysteme (Crawling -> Indexierung -> Ranking) liefern eine Top-N-Kandidatenliste relevanter Dokumente. Ein Large Language Model (seit 2025: Gemini 2.5) erzeugt daraus eine semantisch kohärente Antwort, zitiert Quellen-URLs und verweist auf Ads-Slots. Google betont, dass Schritt 1 weiterhin von denselben Qualitäts- und Ranking-Signalen abhängt wie die organische Websuche - deshalb ist 'normale SEO' der Hebel für Sichtbarkeit in AIO.
2. Die Pipeline im Detail
Crawling & Parsing: Googlebot folgt robots.txt / Meta-robots. HTML wird in Document DOM + Structured Data Graph (Schema.org/JSON-LD) zerlegt. SEO-Relevanz: Klassische Hygiene (Indexierbarkeit, Page Speed, canonicals, hreflang).
Indexierung: Textual Inverted Index (BM25-ähnlich), Dense Vector Index (dual-encoder Embeddings), Link Graph & Entity Graph. SEO-Relevanz: Gute Gliederung, semantische Tiefe - bessere Sparse + Dense Matches.
First-Pass Retrieval ('Fan-out'): Für komplexe Queries zerlegt Gemini Sub-fragen ('query decomposition'). Parallel Abruf von 100-200 Dokumenten pro Sub-frage aus beiden Indizes. SEO-Relevanz: Semantische Relevanz auf Absatz-Ebene wichtig (Heading-Struktur, FAQs).
Re-Ranking: Hybrid: BM25-Score + PageRank + EAT-Signale + LLM-based Cross-Encoder. 'Helpful Content System' entfernt Keyword-Spam. SEO-Relevanz: Autorität (Backlinks, Brand), Experience-Signale (First-Hand Content).
LLM Reasoning: Gemini erhält context window ca. 300k Tokens. Structured Citation Extraction: Modell lernt, Sätze mit URLs zu verknüpfen. Halluzinations-Filter: Antwort vs. Dokument-Evidence Score. SEO-Relevanz: Gute Passage-Qualität erhöht Wahrscheinlichkeit, zitiert zu werden.
Output-Assembly: Antwort-Synthese in unter 1 s (Google I/O 2025: 300 ms Median). UI ordnet Quellen unter AIO-Kasten ein. SERP-CTR: erster Link im AIO-Snippet erhält derzeit ca. 25 % aller Klicks.
3. Steuermechanismen & Ablehnung von LLMS.txt
Google akzeptiert weiterhin nur: robots.txt (z. B. User-agent: Googlebot -> Disallow), Meta-Tags (noindex, nosnippet), IP-/Header-Beschränkungen (Paywall Handling). Eine separate Datei LLMS.txt 'zum Ausschluss von LLM-Crawling' liest Google nicht aus.
Gründe: Erstens komplexes Multi-Agent-Ökosystem: Googlebot, Gemini-Retriever, AdsBot - einzelne Blockliste würde das System zerreissen. Zweitens Backward Compatibility: robots.txt ist Standard seit 1994, unterstützt Crawler-Klassen und Wildcards. Drittens Nutzerschutz & Transparenz: Google muss Nutzern konsistente Crawling-Signale garantieren; zusätzliche Layer erhöhen Fehlerquote.
4. Besondere Ranking-Signale für AIO
Passage-Level Usefulness: BERT-ähnliche Klassifikation 'beantwortet Passage die Frage?' - Wichtigkeit: sehr hoch. Citation Consistency: Übereinstimmung zwischen generiertem Satz & evidenter Passage (LLM-Critic) - Wichtigkeit: hoch. Multimodal Fitness: Bilder/Schema-Markup, die Gemini in multimodalen Antworten referenzieren kann - Wichtigkeit: mittel. Freshness-Boost: Rapid Re-ranking für News/Events (unter 48 h) - Wichtigkeit: mittel. Harm & Safety Filter: Blockiert toxische, medizinische Fehlinfos - Wichtigkeit: Ausschlusskriterium.
5. Structured Data & KI-Erweiterungen
HowTo, FAQ, Recipe-Markup haben hohe Chance, als step-by-step Komponenten in AIO eingeblendet zu werden. Seit März 2025 liest der Gemini-Retriever auch author.url und author.expertise Felder aus, um E-E-A-T zu evaluieren.
6. Metriken & Monitoring
In den Search Console Performance-Reports wurde das Filter-Label 'AI Overview' ausgerollt (Property > Search Appearance). Datapoints: Impressions, Clicks, Position innerhalb der AIO-Quellenliste. API-Export ermöglicht Korrelation mit klassischer SERP-Position.