🟢 Plain Language

Ein sehr großes KI-Modell das auf riesigen Datenmengen trainiert wurde und als Basis für viele verschiedene KI-Anwendungen dient.

🔵 Expert Level

Foundation Model als pre-trained large-scale model: emergente Fähigkeiten durch Scale (Scaling Laws: Compute, Data, Parameters). Typen: LLM (GPT-4, Claude), Vision Foundation Model (DALL-E, Stable Diffusion), Multimodal (Gemini). EU AI Act unterscheidet Foundation Model (kein eigener Rechtsbegriff) von GPAI-Modell (definiert in Art. 3(63)).

Definition

Ein Foundation Model (Basismodell) ist ein KI-Modell, das:

auf sehr großen Datensätzen (Internet-Scale) vortrainiert wurde
durch Transfer Learning für viele Downstream-Aufgaben adaptierbar ist
als Ausgangspunkt für spezialisierte Modelle dient

Der Begriff wurde 2021 von Forschern der Stanford University geprägt.

Typen von Foundation Models

Typ	Modalität	Beispiele
LLM	Text	GPT-4, Claude, Llama 3, Mistral, Gemini
Vision-Language	Text + Bild	GPT-4V, LLaVA, Gemini Vision
Bild-Generierung	Text → Bild	DALL-E 3, FLUX.1, Stable Diffusion
Code	Text + Code	GitHub Copilot, CodeLlama, DeepSeek Coder
Audio	Audio + Text	Whisper, MusicGen
Multimodal	Alle	GPT-4o, Gemini Ultra

Trainingsaufwand und EU AI Act

Der EU AI Act unterscheidet Foundation Models nach Trainings-Rechenleistung:

Schwelle	Regulierung
< 10²³ FLOP	Keine spezifischen GPAI-Pflichten
≥ 10²³ FLOP	GPAI-Dokumentationspflichten (Kap. V)
≥ 10²⁵ FLOP	Systemisches Risiko → erweiterte Pflichten

Open vs. Closed Weight Models

	Open Weight	Closed/Proprietary
Gewichte	Öffentlich verfügbar	Privat
Deployment	Lokal möglich	Nur via API
Datenschutz	Hoch (lokal)	API-Abhängigkeit
Kosten	Infrastruktur	Pay-per-token
EU AI Act	Erleichterte Anforderungen	Vollständige Pflichten
Beispiele	Llama 3, Mistral, Phi	GPT-4, Claude, Gemini

Foundation Models in IIO

IIO betreibt Foundation Models lokal via AI Hub:

Inferenz: Ollama auf dediziertem GPU-Server (inhzgx4/inhzgx9)
Modelle: Qwen 2.5 (7B, 32B, 72B), Deepseek-Coder, Codestral
Routing: LiteLLM unified API mit Alias-System
Datenschutz: Daten verlassen nie die IIO-Infrastruktur

Governance-Anforderungen für FM-Betreiber

Modell-Inventar führen (Model Card für jedes genutzte Modell)
GPAI-Klassifizierung prüfen (Trainingsrechenleistung bekannt?)
Verwendungszweck dokumentieren
Output-Monitoring für systematische Fehler
Transparenzpflicht bei Nutzung gegenüber Endnutzern (EU AI Act Art. 50)

引用

"Foundation Model." Open Cognition Commons Foundation. https://opencognitioncommons.org/zh/glossary/foundation-model. CC-BY 4.0.

机器可读元数据

{
  "@context": "https://schema.org",
  "@type": "DefinedTerm",
  "name": "Foundation Model",
  "description": "Ein Foundation Model ist ein auf großen Datensätzen trainiertes KI-Modell, das durch Fine-Tuning oder Prompting für viele verschiedene Aufgaben eingesetzt werden kann, ohne von Grund auf neu trainiert werden zu müssen.\n",
  "url": "https://opencognitioncommons.org/zh/glossary/foundation-model",
  "license": "https://creativecommons.org/licenses/by/4.0/",
  "alternateName": [
    "Foundation Model",
    "Basismodell",
    "Large Language Model",
    "LLM",
    "FM"
  ]
}