← Alle Artikel

31. März 2025

Fachartikel: Technische Tiefenschau - Wie Google AI Overviews Inhalte findet, bewertet und generiert

Google AI Overviews basieren auf einem RAG-System mit Gemini. Technische Analyse der Pipeline: Crawling, Retrieval, Re-Ranking, LLM Reasoning und Output-Assembly.

1. Einordnung: Von klassischen Ergebnissen zu AI Overviews

AI Overviews (AIO) sind ein Retrieval-Augmented-Generation-System (RAG): Klassische Suchsysteme (Crawling -> Indexierung -> Ranking) liefern eine Top-N-Kandidatenliste relevanter Dokumente. Ein Large Language Model (seit 2025: Gemini 2.5) erzeugt daraus eine semantisch kohärente Antwort, zitiert Quellen-URLs und verweist auf Ads-Slots. Google betont, dass Schritt 1 weiterhin von denselben Qualitäts- und Ranking-Signalen abhängt wie die organische Websuche - deshalb ist 'normale SEO' der Hebel für Sichtbarkeit in AIO.

2. Die Pipeline im Detail

Crawling & Parsing: Googlebot folgt robots.txt / Meta-robots. HTML wird in Document DOM + Structured Data Graph (Schema.org/JSON-LD) zerlegt. SEO-Relevanz: Klassische Hygiene (Indexierbarkeit, Page Speed, canonicals, hreflang).

Indexierung: Textual Inverted Index (BM25-ähnlich), Dense Vector Index (dual-encoder Embeddings), Link Graph & Entity Graph. SEO-Relevanz: Gute Gliederung, semantische Tiefe - bessere Sparse + Dense Matches.

First-Pass Retrieval ('Fan-out'): Für komplexe Queries zerlegt Gemini Sub-fragen ('query decomposition'). Parallel Abruf von 100-200 Dokumenten pro Sub-frage aus beiden Indizes. SEO-Relevanz: Semantische Relevanz auf Absatz-Ebene wichtig (Heading-Struktur, FAQs).

Re-Ranking: Hybrid: BM25-Score + PageRank + EAT-Signale + LLM-based Cross-Encoder. 'Helpful Content System' entfernt Keyword-Spam. SEO-Relevanz: Autorität (Backlinks, Brand), Experience-Signale (First-Hand Content).

LLM Reasoning: Gemini erhält context window ca. 300k Tokens. Structured Citation Extraction: Modell lernt, Sätze mit URLs zu verknüpfen. Halluzinations-Filter: Antwort vs. Dokument-Evidence Score. SEO-Relevanz: Gute Passage-Qualität erhöht Wahrscheinlichkeit, zitiert zu werden.

Output-Assembly: Antwort-Synthese in unter 1 s (Google I/O 2025: 300 ms Median). UI ordnet Quellen unter AIO-Kasten ein. SERP-CTR: erster Link im AIO-Snippet erhält derzeit ca. 25 % aller Klicks.

3. Steuermechanismen & Ablehnung von LLMS.txt

Google akzeptiert weiterhin nur: robots.txt (z. B. User-agent: Googlebot -> Disallow), Meta-Tags (noindex, nosnippet), IP-/Header-Beschränkungen (Paywall Handling). Eine separate Datei LLMS.txt 'zum Ausschluss von LLM-Crawling' liest Google nicht aus.

Gründe: Erstens komplexes Multi-Agent-Ökosystem: Googlebot, Gemini-Retriever, AdsBot - einzelne Blockliste würde das System zerreissen. Zweitens Backward Compatibility: robots.txt ist Standard seit 1994, unterstützt Crawler-Klassen und Wildcards. Drittens Nutzerschutz & Transparenz: Google muss Nutzern konsistente Crawling-Signale garantieren; zusätzliche Layer erhöhen Fehlerquote.

4. Besondere Ranking-Signale für AIO

Passage-Level Usefulness: BERT-ähnliche Klassifikation 'beantwortet Passage die Frage?' - Wichtigkeit: sehr hoch. Citation Consistency: Übereinstimmung zwischen generiertem Satz & evidenter Passage (LLM-Critic) - Wichtigkeit: hoch. Multimodal Fitness: Bilder/Schema-Markup, die Gemini in multimodalen Antworten referenzieren kann - Wichtigkeit: mittel. Freshness-Boost: Rapid Re-ranking für News/Events (unter 48 h) - Wichtigkeit: mittel. Harm & Safety Filter: Blockiert toxische, medizinische Fehlinfos - Wichtigkeit: Ausschlusskriterium.

5. Structured Data & KI-Erweiterungen

HowTo, FAQ, Recipe-Markup haben hohe Chance, als step-by-step Komponenten in AIO eingeblendet zu werden. Seit März 2025 liest der Gemini-Retriever auch author.url und author.expertise Felder aus, um E-E-A-T zu evaluieren.

6. Metriken & Monitoring

In den Search Console Performance-Reports wurde das Filter-Label 'AI Overview' ausgerollt (Property > Search Appearance). Datapoints: Impressions, Clicks, Position innerhalb der AIO-Quellenliste. API-Export ermöglicht Korrelation mit klassischer SERP-Position.

google-ai-overviewsragseogeminitechnische-seo