Fachartikel: Technische Tiefen­schau – Wie Google AI Overviews Inhalte findet, bewertet und generiert

Jul 31, 2025By Holger von Ellerts
Holger von Ellerts

1. Einordnung: Von klassischen Ergebnissen zu AI Overviews


AI Overviews (AIO) sind ein Retrieval-Augmented-Generation-System (RAG):

Klassische Suchsysteme (Crawling → Indexierung → Ranking) liefern eine Top-N-Kandidatenliste relevanter Dokumente.
Ein Large Language Model (seit 2025: Gemini 2.5) erzeugt daraus eine semantisch kohärente Antwort, zitiert Quellen-URLs und verweist auf Ads-Slots.
Google betont, dass Schritt 1 weiterhin von denselben Qualitäts- und Ranking-Signalen abhängt wie die organische Websuche – deshalb ist „normale SEO“ der Hebel für Sichtbarkeit in AIO.


2. Die Pipeline im Detail


Pipeline-StufeTechnische KernelementeSEO-Relevanz
Crawling & Parsing

Googlebot folgt robots.txt / Meta-robots.

HTML wird in Document DOM + Structured Data Graph (Schema.org/JSON-LD) zerlegt.

Klassische Hygiene (Indexierbarkeit, Page Speed, canonicals, hreflang).
Indexierung

Textual Inverted Index (BM25-ähnlich).

Dense Vector Index (dual-encoder Embeddings).

Link Graph & Entity Graph.

Gute Gliederung, semantische Tiefe → bessere Sparse + Dense Matches.
First-Pass Retrieval („Fan-out“)

Für komplexe Queries zerlegt Gemini Sub-fragen (“query decomposition”).

Parallel Abruf von 100-200 Dokumenten pro Sub-frage aus beiden Indizes.

Semantische Relevanz auf Absatz-Ebene wichtig (Heading-Struktur, FAQs).
Re-Ranking

Hybrid: BM25-Score + PageRank + EAT-Signale + LLM-based Cross-Encoder.

„Helpful Content System“ entfernt Keyword-Spam.

Autorität (Backlinks, Brand), Experience-Signale (First-Hand Content).
LLM Reasoning

Gemini erhält context window ≈ 300 k Tokens.

Structured Citation Extraction: Modell lernt, Sätze mit URLs zu verknüpfen.

Halluzinations-Filter: Antwort vs. Dokument-Evidence Score.

Gute Passage-Qualität erhöht Wahrscheinlichkeit, zitiert zu werden.
Output-Assembly

Antwort-Synthese in < 1 s (Google I/O 2025: 300 ms Median).

UI ordnet Quellen unter AIO-Kasten ein.

Serp-CTR: erster Link im AIO-Snippet erhält derzeit ~25 % aller Klicks.








3. Steuer­mechanismen & Ablehnung von LLMS.txt


Google akzeptiert weiterhin nur:

  • robots.txt (z. B. User-agent: Googlebot → Disallow),
  • Meta-Tags (noindex, nosnippet),
  • IP-/Header-Beschränkungen (Paywall Handling)


Eine separate Datei LLMS.txt „zum Ausschluss von LLM-Crawling“ liest Google nicht aus.

Gründe:

  1. Komplexes Multi-Agent-Ökosystem: Googlebot, Gemini-Retriever, AdsBot – einzelne Blockliste würde das System zerreissen.
  2. Backward Compatibility: robots.txt ist Standard seit 1994, unterstützt Crawler-Klassen und Wildcards.
  3. Nutzer­schutz & Transparenz: Google muss Nutzern konsistente Crawling-Signale garantieren; zusätzliche Layer erhöhen Fehlerquote.



4. Besondere Ranking-Signale für AIO

SignalKurzbeschreibungWichtigkeit (Schätzung)
Passage-Level UsefulnessBERT-ähnliche Klassifikation „beantwortet Passage die Frage?“sehr hoch
Citation ConsistencyÜbereinstimmung zw. generiertem Satz & evidenter Passage (LLM-Critic)hoch
Multimodal FitnessBilder/Schema-Markup, die Gemini in multimodalen Antworten referenzieren kannmittel
Freshness-BoostRapid Re-ranking für News/Events (< 48 h)mittel
Harm & Safety FilterBlockiert toxische, medizinische FehlinfosAusschlusskriterium

5. Structured Data & KI-Erweiterungen

  • HowTo, FAQ, Recipe-Markup haben hohe Chance, als step-by-step Komponenten in AIO eingeblendet zu werden.
  • Seit März 2025 liest der Gemini-Retriever auch author.url und author.expertise Felder aus, um E-E-A-T zu evaluieren



6. Metriken & Monitoring

  • In den Search Console Performance-Reports wurde das Filter-Label „AI Overview” ausgerollt (Property > Search Appearance).
  • Datapoints: Impressions, Clicks, Position innerhalb der AIO-Quellenliste.
  • API-Export ermöglicht Korrelation mit klassischer SERP-Position


Primärquellen (offizielle Google-Statements & Dokumentation)


Google Blog: Generative AI in Search – Let Google do the searching for you
https://blog.google/products/search/generative-ai-google-search-may-2024/
→ Offizielle Ankündigung und technische Hintergründe zu AI Overviews, Funktionsweise, Traffic-Auswirkungen und Qualitätsprinzipien.

Google Blog: AI Mode in Google Search – Updates von der Google I/O 2025
https://blog.google/products/search/google-search-ai-mode-update/
→ Details zu Gemini 2.5, Query-Fanout, Multimodalität und der Integration von AI Overviews in die Suche.

Google Blog: Expanding AI Overviews and introducing AI Mode
https://blog.google/products/search/ai-mode-search/
→ Technische Einblicke in die Pipeline, neue Features und geplante Erweiterungen.

Google Search Central: Office Hours, März 2025
(Zusammenfassungen und Transkripte werden regelmässig von der Community veröffentlicht, z.B. auf searchengineland.com und seroundtable.com.)
 


Sekundärquellen (Fachpresse, Studien, Analysen)


Search Engine Land: Google says normal SEO works for ranking in AI Overviews and LLMS.txt won’t be used
https://searchengineland.com/google-says-normal-seo-works-for-ranking-in-ai-overviews-and-llms-txt-wont-be-used-459422
→ Zentrale Quelle für die Bestätigung, dass LLMS.txt ignoriert wird und klassische SEO weiterhin massgeblich ist.

Search Engine Land: Google AI Overviews – Everything you need to know
https://searchengineland.com/google-ai-overviews-everything-you-need-to-know-449399
→ Überblick über Funktionsweise, Ranking-Faktoren und Auswirkungen auf die SERPs.

BrightEdge Research: AI Overviews and Organic Ranking Overlap (Mai 2025)
(Ergebnisse werden häufig in Fachartikeln wie searchengineland.com zitiert.)
→ Statistische Auswertung zur Überschneidung von Top-10 Rankings und AI Overview-Quellen.

Google Search Central Dokumentation
https://developers.google.com/search/docs
→ Technische Details zu Structured Data, robots.txt, Meta-Tags und neuen Markup-Standards.
 


Weitere relevante Quellen


Google Search Console Hilfe: Search Appearance – AI Overview
https://support.google.com/webmasters/answer/11546954?hl=de
→ Informationen zu neuen Berichts-Labels und Monitoring-Möglichkeiten.

Google Search Central Blog: Helpful Content System
https://developers.google.com/search/blog/2022/08/helpful-content-update
→ Hintergrund zu den Qualitätsfiltern, die auch für AI Overviews gelten.