Skip to main content
← Glossary
technology

추출 증가 생성 (RAG)

RAG · Retrieval-Augmented Generation

1 min read 2026년 5월 19일
Retrieval-Augmented Generation (RAG) ist eine KI-Architektur, bei der ein Sprachmodell vor der Antwortgenerierung relevante Informationen aus einer Wissensdatenbank abruft und als Kontext erhält — statt ausschließlich auf sein Trainings-Wissen zu vertrauen.
🟢 Plain Language

Retrieval-Augmented Generation (RAG) bedeutet: Retrieval-Augmented Generation (RAG) ist eine KI-Architektur, bei der ein Sprachmodell vor der Antwortgenerierung relevante Informationen aus einer Wissensdatenbank abruft und als Kontext erhält — statt ausschließlich auf sein Trainings-Wissen zu vertrauen. Das ist wichtig, weil KI-Systeme heute überall eingesetzt werden und Regeln brauchen, damit sie sicher und fair funktionieren.

🔵 Expert Level

Retrieval-Augmented Generation (RAG) ist eine KI-Architektur, bei der ein Sprachmodell vor der Antwortgenerierung relevante Informationen aus einer Wissensdatenbank abruft und als Kontext erhält — statt ausschließlich auf sein Trainings-Wissen zu vertrauen. [IIO Framework] Retrieval-Augmented Generation: KI-Technik die externe Wissensquellen in die Antwortgenerierung einbezieht. IIO RAG-Stack: Ollama + Qdrant + Tika + OpenWebUI. [NIST GenAI RMF] Intellectual Property GAI resources; Apply organizational risk tolerances to fine-tuned third-party models; Apply organizational risk tolerance to existing third-party models adapted to a new domain; Reassess risk measurements after fine-tuning third- party GAI models. Data Privacy; Information Securi [NIST GenAI RMF] their MS-2.2-003 Configuration; Information consent for present or future use of their data in GAI applications. Integrity Use techniques such as anonymization, differential privacy or other privacy- Data Privacy; Human-AI MS-2.2-004 enhancing technologies to minimize the risks associated with linking

Definition

RAG (Retrieval-Augmented Generation) kombiniert zwei Komponenten:

  1. Retrieval — Suche nach relevanten Dokumenten/Chunks aus einer Wissensdatenbank
  2. Generation — Sprachmodell generiert Antwort basierend auf abgerufenen Dokumenten + Anfrage
Nutzeranfrage

[Retriever] → sucht in Vektordatenbank → relevante Chunks

[Generator] ← Chunks + Anfrage als Kontext

Antwort (faktenbasiert, quellengestützt)

Warum RAG?

ProblemOhne RAGMit RAG
HalluzinationenHäufigStark reduziert
AktualitätTrainings-CutoffEchtzeit-Daten möglich
QuellenKeineExplizit zitierbar
DomänenwissenGenerischSpezialisierbar
DatenschutzDaten im ModellDaten extern, kontrolliert

Technische Komponenten

1. Dokumenten-Pipeline

  • Ingestion — Dokumente laden (PDF, HTML, Markdown)
  • Chunking — in semantische Segmente aufteilen (500–1000 Token)
  • Embedding — Chunks als Vektoren repräsentieren
  • Indexierung — in Vektordatenbank speichern

2. Query-Pipeline

  • Query-Embedding — Anfrage als Vektor
  • Similarity Search — top-k ähnliche Chunks finden
  • Context-Assembly — Chunks + System-Prompt zusammenstellen
  • Generation — LLM generiert fundierte Antwort

RAG vs. Fine-Tuning

RAGFine-Tuning
AufwandNiedrig-mittelHoch
AktualitätDynamischStatisch (retrain nötig)
TransparenzHoch (Quellen sichtbar)Niedrig
KostenGünstigTeuer
DomänenanpassungGut für FaktenGut für Stil/Verhalten

IIO RAG-Stack

IIO nutzt RAG für den OCC Knowledge Base Zugriff:

  • Vektordatenbank: Qdrant (lokal, DSGVO-konform)
  • Embeddings: lokale Modelle via Ollama
  • Retrieval: BM25 + semantic search hybrid
  • Generator: lokale Modelle oder externe API
  • API: POST /api/occ/rag — öffentlich, keine Auth

Governance-Aspekte

RAG-Systeme unterliegen denselben Governance-Anforderungen wie andere KI:

  • Quellenqualität und -lizenz dokumentieren
  • Ausgaben auf Korrektheit prüfen (HITL bei kritischen Entscheidungen)
  • Datenschutz: keine personenbezogenen Daten in Retrievalkorpus ohne Einwilligung

Citation

"추출 증가 생성 (RAG)." Open Cognition Commons Foundation. https://opencognitioncommons.org/ko/glossary/retrieval-augmented-generation. CC-BY 4.0.
Machine-readable metadata
{
  "@context": "https://schema.org",
  "@type": "DefinedTerm",
  "name": "추출 증가 생성 (RAG)",
  "description": "Retrieval-Augmented Generation (RAG) ist eine KI-Architektur, bei der ein Sprachmodell vor der Antwortgenerierung relevante Informationen aus einer Wissensdatenbank abruft und als Kontext erhält — statt ausschließlich auf sein Trainings-Wissen zu vertrauen.\n",
  "url": "https://opencognitioncommons.org/ko/glossary/retrieval-augmented-generation",
  "license": "https://creativecommons.org/licenses/by/4.0/",
  "alternateName": [
    "RAG",
    "Retrieval-Augmented Generation"
  ]
}

Course available at learn.iio.space

RAG with Local AI Hub →