Skip to main content
← Glossary
technology

로컬 AI

Local AI · On-Premise AI · Self-hosted AI · lokale KI

1 min read 2026년 5월 19일
Local AI bezeichnet den Betrieb von KI-Modellen und -Diensten auf eigener, lokal kontrollierter Infrastruktur — im Gegensatz zur Nutzung externer Cloud-APIs. Alle Daten verbleiben in der eigenen Infrastruktur.
🟢 Plain Language

Local AI bedeutet: Local AI bezeichnet den Betrieb von KI-Modellen und -Diensten auf eigener, lokal kontrollierter Infrastruktur — im Gegensatz zur Nutzung externer Cloud-APIs. Das ist wichtig, weil KI-Systeme heute überall eingesetzt werden und Regeln brauchen, damit sie sicher und fair funktionieren.

🔵 Expert Level

Local AI bezeichnet den Betrieb von KI-Modellen und -Diensten auf eigener, lokal kontrollierter Infrastruktur — im Gegensatz zur Nutzung externer Cloud-APIs. Alle Daten verbleiben in der eigenen Infrastruktur. [IIO Framework] LiteLLM Proxy (IIO AI Hub): OpenAI-compatible multi-model proxy running on inhzgx9. Exposes 9 models: local-chat (qwen2.5:32b), local-vision (llama3.2-vision:11b), local-embed (nomic), local-fast, local-code, local-router, claude-haiku-4-5 (Anthropic), gpt-4.1-mini (OpenAI), gemini-1.5-flash. Master [IIO Framework] Ollama: Open-source local LLM inference server. IIO uses Ollama on inhzgx9 (RTX PRO 6000 Blackwell, 96GB VRAM) to serve: qwen2.5:32b (general chat), llama3.2-vision:11b (image analysis), nomic-embed-text (embeddings). Ollama API is OpenAI-compatible. LiteLLM proxies Ollama models under the aliases: [IIO-SRC-012] IIO smoke test (35 checks, v2026-05-15): Portal URLs (7), AI Hub (2), OCC (2), Services (4), Chain-10 dry-run (1), iio-welcome (2), Layer System (8), Layer Documentation (4), API Server (2), Notification System (3). Result: 35 PASS / 3 WARN / 0 FAIL. 3 WARNs are expected: OCC RAG (WireGuard), API /h

Definition

Local AI bezeichnet den Ansatz, KI-Modelle auf eigener Infrastruktur zu betreiben — ohne Daten an externe Cloud-Anbieter zu übertragen.

Vorteile gegenüber Cloud-KI

AspektCloud-KI (OpenAI, Anthropic)Local AI
DatenschutzDaten verlassen UnternehmenDaten bleiben intern
DSGVODrittland-Transfers problematischEU-konform by default
KostenPay-per-token (skaliert mit Nutzung)Fix (Hardware/Strom)
LatenzNetzwerk-abhängigLokal (ms statt s)
OfflineNeinJa
KontrolleAnbieter-abhängigVollständig
Modell-WahlBeschränktAlle Open-Weight-Modelle
LeistungSOTAAbhängig von Hardware

Technischer Stack

Minimaler Local AI Stack

Ollama          ← Modell-Laufzeit (llama.cpp, GPU-Support)

LiteLLM         ← OpenAI-kompatibler API-Proxy, Routing

OpenWebUI       ← Browser-UI für Chat, RAG, Knowledge Base

Keycloak        ← Authentifizierung, RBAC

IIO AI Hub (Referenzimplementierung)

  • Server: Dedizierte GPU-Server (inhzgx4: RTX 4090, inhzgx9: H100)
  • Modelle: Qwen 2.5 (7B→72B), Deepseek-Coder, Codestral
  • Routing: LiteLLM mit Aliases (ops-fast, code-generate, reason-deep)
  • Zugang: SSO via Keycloak, interne URLs
  • Kosten: Einmalige Hardware + Strom vs. Cloud-API-Kosten

DSGVO und Local AI

Local AI vereinfacht DSGVO-Compliance erheblich:

DSGVO-AnforderungCloud-KILocal AI
Art. 44 — Drittland-TransferSchwierig (US-Anbieter)Kein Transfer
Art. 28 — AuftragsverarbeitungAVV mit Anbieter nötigKein Auftragsverarbeiter
Art. 25 — Privacy by DesignAnbieter-abhängigVollständige Kontrolle
DatenlöschungAnbieter muss löschenDirekte Kontrolle

Wann Local AI, wann Cloud?

Local AI empfohlen für:

  • Verarbeitung personenbezogener Daten
  • Vertrauliche Geschäftsdaten, Finanz-, HR-Daten
  • Hochvolumen-Anwendungen (Kostenersparnis ab ~1M Token/Tag)
  • Compliance-kritische Bereiche (Gesundheit, Recht, Behörden)

Cloud-KI kann sinnvoll sein für:

  • SOTA-Leistung (GPT-4o, Claude 3.5+ bei komplexen Tasks)
  • Seltene, unkritische Nutzung
  • Teams ohne IT-Kapazität für Eigenbetrieb

Governance-Empfehlungen

  1. Modell-Inventar — alle betriebenen Modelle mit Version und Zweck dokumentieren
  2. Zugriffskontrolle — SSO + RBAC, kein anonymer Zugang
  3. Audit Trail — alle Prompts und Completions optional loggen (Opt-in)
  4. Update-Prozess — Modell-Updates wie Software-Deployments behandeln
  5. Backup — Modell-Gewichte sichern (Verfügbarkeit)

Citation

"로컬 AI." Open Cognition Commons Foundation. https://opencognitioncommons.org/ko/glossary/local-ai. CC-BY 4.0.
Machine-readable metadata
{
  "@context": "https://schema.org",
  "@type": "DefinedTerm",
  "name": "로컬 AI",
  "description": "Local AI bezeichnet den Betrieb von KI-Modellen und -Diensten auf eigener, lokal kontrollierter Infrastruktur — im Gegensatz zur Nutzung externer Cloud-APIs. Alle Daten verbleiben in der eigenen Infrastruktur.\n",
  "url": "https://opencognitioncommons.org/ko/glossary/local-ai",
  "license": "https://creativecommons.org/licenses/by/4.0/",
  "alternateName": [
    "Local AI",
    "On-Premise AI",
    "Self-hosted AI",
    "lokale KI"
  ]
}

Course available at learn.iio.space

Local AI with Ollama →