Ein sehr großes KI-Modell das auf riesigen Datenmengen trainiert wurde und als Basis für viele verschiedene KI-Anwendungen dient.
Foundation Model als pre-trained large-scale model: emergente Fähigkeiten durch Scale (Scaling Laws: Compute, Data, Parameters). Typen: LLM (GPT-4, Claude), Vision Foundation Model (DALL-E, Stable Diffusion), Multimodal (Gemini). EU AI Act unterscheidet Foundation Model (kein eigener Rechtsbegriff) von GPAI-Modell (definiert in Art. 3(63)).
Definition
Ein Foundation Model (Basismodell) ist ein KI-Modell, das:
- auf sehr großen Datensätzen (Internet-Scale) vortrainiert wurde
- durch Transfer Learning für viele Downstream-Aufgaben adaptierbar ist
- als Ausgangspunkt für spezialisierte Modelle dient
Der Begriff wurde 2021 von Forschern der Stanford University geprägt.
Typen von Foundation Models
| Typ | Modalität | Beispiele |
|---|---|---|
| LLM | Text | GPT-4, Claude, Llama 3, Mistral, Gemini |
| Vision-Language | Text + Bild | GPT-4V, LLaVA, Gemini Vision |
| Bild-Generierung | Text → Bild | DALL-E 3, FLUX.1, Stable Diffusion |
| Code | Text + Code | GitHub Copilot, CodeLlama, DeepSeek Coder |
| Audio | Audio + Text | Whisper, MusicGen |
| Multimodal | Alle | GPT-4o, Gemini Ultra |
Trainingsaufwand und EU AI Act
Der EU AI Act unterscheidet Foundation Models nach Trainings-Rechenleistung:
| Schwelle | Regulierung |
|---|---|
| < 10²³ FLOP | Keine spezifischen GPAI-Pflichten |
| ≥ 10²³ FLOP | GPAI-Dokumentationspflichten (Kap. V) |
| ≥ 10²⁵ FLOP | Systemisches Risiko → erweiterte Pflichten |
Open vs. Closed Weight Models
| Open Weight | Closed/Proprietary | |
|---|---|---|
| Gewichte | Öffentlich verfügbar | Privat |
| Deployment | Lokal möglich | Nur via API |
| Datenschutz | Hoch (lokal) | API-Abhängigkeit |
| Kosten | Infrastruktur | Pay-per-token |
| EU AI Act | Erleichterte Anforderungen | Vollständige Pflichten |
| Beispiele | Llama 3, Mistral, Phi | GPT-4, Claude, Gemini |
Foundation Models in IIO
IIO betreibt Foundation Models lokal via AI Hub:
- Inferenz: Ollama auf dediziertem GPU-Server (inhzgx4/inhzgx9)
- Modelle: Qwen 2.5 (7B, 32B, 72B), Deepseek-Coder, Codestral
- Routing: LiteLLM unified API mit Alias-System
- Datenschutz: Daten verlassen nie die IIO-Infrastruktur
Governance-Anforderungen für FM-Betreiber
- Modell-Inventar führen (Model Card für jedes genutzte Modell)
- GPAI-Klassifizierung prüfen (Trainingsrechenleistung bekannt?)
- Verwendungszweck dokumentieren
- Output-Monitoring für systematische Fehler
- Transparenzpflicht bei Nutzung gegenüber Endnutzern (EU AI Act Art. 50)
引用
"Foundation Model." Open Cognition Commons Foundation. https://opencognitioncommons.org/zh/glossary/foundation-model. CC-BY 4.0. 机器可读元数据
{
"@context": "https://schema.org",
"@type": "DefinedTerm",
"name": "Foundation Model",
"description": "Ein Foundation Model ist ein auf großen Datensätzen trainiertes KI-Modell, das durch Fine-Tuning oder Prompting für viele verschiedene Aufgaben eingesetzt werden kann, ohne von Grund auf neu trainiert werden zu müssen.\n",
"url": "https://opencognitioncommons.org/zh/glossary/foundation-model",
"license": "https://creativecommons.org/licenses/by/4.0/",
"alternateName": [
"Foundation Model",
"Basismodell",
"Large Language Model",
"LLM",
"FM"
]
}