Retrieval-Augmented Generation (RAG) bedeutet: Retrieval-Augmented Generation (RAG) ist eine KI-Architektur, bei der ein Sprachmodell vor der Antwortgenerierung relevante Informationen aus einer Wissensdatenbank abruft und als Kontext erhält — statt ausschließlich auf sein Trainings-Wissen zu vertrauen. Das ist wichtig, weil KI-Systeme heute überall eingesetzt werden und Regeln brauchen, damit sie sicher und fair funktionieren.
Retrieval-Augmented Generation (RAG) ist eine KI-Architektur, bei der ein Sprachmodell vor der Antwortgenerierung relevante Informationen aus einer Wissensdatenbank abruft und als Kontext erhält — statt ausschließlich auf sein Trainings-Wissen zu vertrauen. [IIO Framework] Retrieval-Augmented Generation: KI-Technik die externe Wissensquellen in die Antwortgenerierung einbezieht. IIO RAG-Stack: Ollama + Qdrant + Tika + OpenWebUI. [NIST GenAI RMF] Intellectual Property GAI resources; Apply organizational risk tolerances to fine-tuned third-party models; Apply organizational risk tolerance to existing third-party models adapted to a new domain; Reassess risk measurements after fine-tuning third- party GAI models. Data Privacy; Information Securi [NIST GenAI RMF] their MS-2.2-003 Configuration; Information consent for present or future use of their data in GAI applications. Integrity Use techniques such as anonymization, differential privacy or other privacy- Data Privacy; Human-AI MS-2.2-004 enhancing technologies to minimize the risks associated with linking
Definition
RAG (Retrieval-Augmented Generation) kombiniert zwei Komponenten:
- Retrieval — Suche nach relevanten Dokumenten/Chunks aus einer Wissensdatenbank
- Generation — Sprachmodell generiert Antwort basierend auf abgerufenen Dokumenten + Anfrage
Nutzeranfrage
↓
[Retriever] → sucht in Vektordatenbank → relevante Chunks
↓
[Generator] ← Chunks + Anfrage als Kontext
↓
Antwort (faktenbasiert, quellengestützt)
Warum RAG?
| Problem | Ohne RAG | Mit RAG |
|---|---|---|
| Halluzinationen | Häufig | Stark reduziert |
| Aktualität | Trainings-Cutoff | Echtzeit-Daten möglich |
| Quellen | Keine | Explizit zitierbar |
| Domänenwissen | Generisch | Spezialisierbar |
| Datenschutz | Daten im Modell | Daten extern, kontrolliert |
Technische Komponenten
1. Dokumenten-Pipeline
- Ingestion — Dokumente laden (PDF, HTML, Markdown)
- Chunking — in semantische Segmente aufteilen (500–1000 Token)
- Embedding — Chunks als Vektoren repräsentieren
- Indexierung — in Vektordatenbank speichern
2. Query-Pipeline
- Query-Embedding — Anfrage als Vektor
- Similarity Search — top-k ähnliche Chunks finden
- Context-Assembly — Chunks + System-Prompt zusammenstellen
- Generation — LLM generiert fundierte Antwort
RAG vs. Fine-Tuning
| RAG | Fine-Tuning | |
|---|---|---|
| Aufwand | Niedrig-mittel | Hoch |
| Aktualität | Dynamisch | Statisch (retrain nötig) |
| Transparenz | Hoch (Quellen sichtbar) | Niedrig |
| Kosten | Günstig | Teuer |
| Domänenanpassung | Gut für Fakten | Gut für Stil/Verhalten |
IIO RAG-Stack
IIO nutzt RAG für den OCC Knowledge Base Zugriff:
- Vektordatenbank: Qdrant (lokal, DSGVO-konform)
- Embeddings: lokale Modelle via Ollama
- Retrieval: BM25 + semantic search hybrid
- Generator: lokale Modelle oder externe API
- API:
POST /api/occ/rag— öffentlich, keine Auth
Governance-Aspekte
RAG-Systeme unterliegen denselben Governance-Anforderungen wie andere KI:
- Quellenqualität und -lizenz dokumentieren
- Ausgaben auf Korrektheit prüfen (HITL bei kritischen Entscheidungen)
- Datenschutz: keine personenbezogenen Daten in Retrievalkorpus ohne Einwilligung
Citation
"추출 증가 생성 (RAG)." Open Cognition Commons Foundation. https://opencognitioncommons.org/ko/glossary/retrieval-augmented-generation. CC-BY 4.0. Machine-readable metadata
{
"@context": "https://schema.org",
"@type": "DefinedTerm",
"name": "추출 증가 생성 (RAG)",
"description": "Retrieval-Augmented Generation (RAG) ist eine KI-Architektur, bei der ein Sprachmodell vor der Antwortgenerierung relevante Informationen aus einer Wissensdatenbank abruft und als Kontext erhält — statt ausschließlich auf sein Trainings-Wissen zu vertrauen.\n",
"url": "https://opencognitioncommons.org/ko/glossary/retrieval-augmented-generation",
"license": "https://creativecommons.org/licenses/by/4.0/",
"alternateName": [
"RAG",
"Retrieval-Augmented Generation"
]
}