GEO / AI-Search

RAG (Retrieval Augmented Generation)

Auch bekannt als: Retrieval Augmented Generation, RAG, Retrieval-Augmented

Retrieval Augmented Generation (RAG) ist eine Technik, die Large Language Models mit aktuellen externen Quellen anreichert. Statt nur auf das beim Training gespeicherte Wissen zurückzugreifen, wird zur Suchanfrage zunächst eine Retrieval-Phase ausgelöst: Relevante Web-Quellen werden gesucht und abgerufen, ihr Inhalt wird dem LLM als Kontext mitgegeben, und das Modell antwortet auf Basis dieser frischen Daten. RAG ist die technische Basis fast aller modernen KI-Suchmaschinen — ChatGPT Search, Perplexity, Gemini, Google AI Overviews nutzen Varianten davon.

Wie RAG technisch funktioniert

  1. Query-Verarbeitung — die User-Anfrage wird in eine semantische Such-Query umgewandelt.
  2. Retrieval — relevante Web-Quellen werden über eine Search-API oder einen Vektor-Index gesucht und top-K Treffer abgerufen.
  3. Context-Konstruktion — der Volltext (oder Auszüge) der Quellen wird in den LLM-Prompt eingespeist, oft mit Quell-IDs zur späteren Verlinkung.
  4. Generation — das LLM verfasst die Antwort auf Basis des Kontexts, idealerweise mit nummerierten Quell-Verweisen.
  5. Citation-Mapping — die genannten Quell-IDs werden in klickbare Links übersetzt.

Was RAG für GEO bedeutet

RAG ist der Mechanismus, der die Glücks-Frage „wie kommt meine Domain in eine KI-Antwort?" beantwortbar macht: Während Pre-Training-Wissen statisch und schwer beeinflussbar ist, ist die Retrieval-Phase live und manipulierbar — über klassische SEO. Wenn meine Seite zum Hauptkeyword auf Top-10 rankt und sauber strukturiert ist, wird sie mit hoher Wahrscheinlichkeit in die Retrieval-Phase aufgenommen und steht dem Modell als Quelle zur Verfügung. Klassisches SEO + Citability-Optimierung ist deshalb die direkte Eintrittstür in RAG-basierte KI-Suche.

Was Quellen-Selection in RAG steuert

Praxisbeispiel

Beispiel: Eine Fach-Domain rankt für „Was ist RLHF" auf Position 5. Bei einer Perplexity-Anfrage zum Thema läuft die RAG-Pipeline: Top-8 Google-Treffer werden abgerufen, ihre Inhalte werden geparst und semantisch gerankt. Die Fach-Domain wird wegen klarer H2-Struktur, expliziter Definition im ersten Absatz und Quellen-Belegen als eine der drei Hauptquellen ausgewählt — und in der Antwort als Quelle 1 verlinkt. Effekt: Der direkte Referral-Traffic aus Perplexity für diesen einen Begriff ist nach 4 Wochen höher als der klassische Google-Klick aus Position 5.

Wird in Rankmio genutzt fuer

Citability-Optimierung für RAG-Pipelines

Zur Funktion →

Letzte Aktualisierung: 2026-06-17  ·  Alle Glossar-Eintraege ansehen

Kostenloser SEO- & GEO-Check

SEO-Score, KI-Sichtbarkeit und Zitierbarkeit deiner Website in 30 Sekunden — ohne Registrierung.

Jetzt kostenlos prüfen

Bereit, deine Website zu optimieren?

Kostenlos registrieren, 10 Credits erhalten und direkt loslegen.

Jetzt registrieren