🟢 Plain Language

KI holt sich relevante Informationen aus einer Wissensbasis bevor sie antwortet — für genauere Antworten.

🔵 Expert Level

RAG-Pipeline: Query → Embedding → Vector-Search → Context-Injection → Generation. Hybrid-RAG kombiniert Dense (Semantic) + Sparse (BM25) Retrieval. Evaluation: Faithfulness, Answer Relevance, Context Recall (RAGAS-Framework). OCC nutzt RAG für AI-Hub.

Definition

RAG (Retrieval-Augmented Generation) kombiniert zwei Komponenten:

Retrieval — Suche nach relevanten Dokumenten/Chunks aus einer Wissensdatenbank
Generation — Sprachmodell generiert Antwort basierend auf abgerufenen Dokumenten + Anfrage

Nutzeranfrage
     ↓
[Retriever] → sucht in Vektordatenbank → relevante Chunks
     ↓
[Generator] ← Chunks + Anfrage als Kontext
     ↓
Antwort (faktenbasiert, quellengestützt)

Warum RAG?

Problem	Ohne RAG	Mit RAG
Halluzinationen	Häufig	Stark reduziert
Aktualität	Trainings-Cutoff	Echtzeit-Daten möglich
Quellen	Keine	Explizit zitierbar
Domänenwissen	Generisch	Spezialisierbar
Datenschutz	Daten im Modell	Daten extern, kontrolliert

Technische Komponenten

1. Dokumenten-Pipeline

Ingestion — Dokumente laden (PDF, HTML, Markdown)
Chunking — in semantische Segmente aufteilen (500–1000 Token)
Embedding — Chunks als Vektoren repräsentieren
Indexierung — in Vektordatenbank speichern

2. Query-Pipeline

Query-Embedding — Anfrage als Vektor
Similarity Search — top-k ähnliche Chunks finden
Context-Assembly — Chunks + System-Prompt zusammenstellen
Generation — LLM generiert fundierte Antwort

RAG vs. Fine-Tuning

	RAG	Fine-Tuning
Aufwand	Niedrig-mittel	Hoch
Aktualität	Dynamisch	Statisch (retrain nötig)
Transparenz	Hoch (Quellen sichtbar)	Niedrig
Kosten	Günstig	Teuer
Domänenanpassung	Gut für Fakten	Gut für Stil/Verhalten

IIO RAG-Stack

IIO nutzt RAG für den OCC Knowledge Base Zugriff:

Vektordatenbank: Qdrant (lokal, DSGVO-konform)
Embeddings: lokale Modelle via Ollama
Retrieval: BM25 + semantic search hybrid
Generator: lokale Modelle oder externe API
API: POST /api/occ/rag — öffentlich, keine Auth

Governance-Aspekte

RAG-Systeme unterliegen denselben Governance-Anforderungen wie andere KI:

Quellenqualität und -lizenz dokumentieren
Ausgaben auf Korrektheit prüfen (HITL bei kritischen Entscheidungen)
Datenschutz: keine personenbezogenen Daten in Retrievalkorpus ohne Einwilligung

引用

"Retrieval-Augmented Generation (RAG)." Open Cognition Commons Foundation. https://opencognitioncommons.org/ja/glossary/retrieval-augmented-generation. CC-BY 4.0.

機械可読メタデータ

{
  "@context": "https://schema.org",
  "@type": "DefinedTerm",
  "name": "Retrieval-Augmented Generation (RAG)",
  "description": "Retrieval-Augmented Generation (RAG) ist eine KI-Architektur, bei der ein Sprachmodell vor der Antwortgenerierung relevante Informationen aus einer Wissensdatenbank abruft und als Kontext erhält — statt ausschließlich auf sein Trainings-Wissen zu vertrauen.\n",
  "url": "https://opencognitioncommons.org/ja/glossary/retrieval-augmented-generation",
  "license": "https://creativecommons.org/licenses/by/4.0/",
  "alternateName": [
    "RAG",
    "Retrieval-Augmented Generation"
  ]
}