Ir para o conteúdo principal
← Glossary
technology

Local AI

Local AI · On-Premise AI · Self-hosted AI · lokale KI

1 min May 19, 2026
Local AI bezeichnet den Betrieb von KI-Modellen und -Diensten auf eigener, lokal kontrollierter Infrastruktur — im Gegensatz zur Nutzung externer Cloud-APIs. Alle Daten verbleiben in der eigenen Infrastruktur.
🟢 Plain Language

KI die auf dem eigenen Computer oder Server läuft — keine Daten gehen in die Cloud. Gut für Datenschutz und Kontrolle.

🔵 Expert Level

Local AI als Datenschutz-Enabler: Modelle laufen on-premise via Ollama, LM Studio, llama.cpp. Technisch: GGUF-Format für quantisierte Modelle (Q4_K_M, Q8_0), llama.cpp als inference engine, Open-Weight-Modelle (Llama, Mistral, Qwen). IIO-Implementierung: Ollama auf IIO-Node + LiteLLM-Gateway für einheitliche API. DSGVO-relevant: keine Übertragung personenbezogener Daten an externe Anbieter.

Definition

Local AI bezeichnet den Ansatz, KI-Modelle auf eigener Infrastruktur zu betreiben — ohne Daten an externe Cloud-Anbieter zu übertragen.

Vorteile gegenüber Cloud-KI

AspektCloud-KI (OpenAI, Anthropic)Local AI
DatenschutzDaten verlassen UnternehmenDaten bleiben intern
DSGVODrittland-Transfers problematischEU-konform by default
KostenPay-per-token (skaliert mit Nutzung)Fix (Hardware/Strom)
LatenzNetzwerk-abhängigLokal (ms statt s)
OfflineNeinJa
KontrolleAnbieter-abhängigVollständig
Modell-WahlBeschränktAlle Open-Weight-Modelle
LeistungSOTAAbhängig von Hardware

Technischer Stack

Minimaler Local AI Stack

Ollama          ← Modell-Laufzeit (llama.cpp, GPU-Support)

LiteLLM         ← OpenAI-kompatibler API-Proxy, Routing

OpenWebUI       ← Browser-UI für Chat, RAG, Knowledge Base

Keycloak        ← Authentifizierung, RBAC

IIO AI Hub (Referenzimplementierung)

  • Server: Dedizierte GPU-Server (inhzgx4: RTX 4090, inhzgx9: H100)
  • Modelle: Qwen 2.5 (7B→72B), Deepseek-Coder, Codestral
  • Routing: LiteLLM mit Aliases (ops-fast, code-generate, reason-deep)
  • Zugang: SSO via Keycloak, interne URLs
  • Kosten: Einmalige Hardware + Strom vs. Cloud-API-Kosten

DSGVO und Local AI

Local AI vereinfacht DSGVO-Compliance erheblich:

DSGVO-AnforderungCloud-KILocal AI
Art. 44 — Drittland-TransferSchwierig (US-Anbieter)Kein Transfer
Art. 28 — AuftragsverarbeitungAVV mit Anbieter nötigKein Auftragsverarbeiter
Art. 25 — Privacy by DesignAnbieter-abhängigVollständige Kontrolle
DatenlöschungAnbieter muss löschenDirekte Kontrolle

Wann Local AI, wann Cloud?

Local AI empfohlen für:

  • Verarbeitung personenbezogener Daten
  • Vertrauliche Geschäftsdaten, Finanz-, HR-Daten
  • Hochvolumen-Anwendungen (Kostenersparnis ab ~1M Token/Tag)
  • Compliance-kritische Bereiche (Gesundheit, Recht, Behörden)

Cloud-KI kann sinnvoll sein für:

  • SOTA-Leistung (GPT-4o, Claude 3.5+ bei komplexen Tasks)
  • Seltene, unkritische Nutzung
  • Teams ohne IT-Kapazität für Eigenbetrieb

Governance-Empfehlungen

  1. Modell-Inventar — alle betriebenen Modelle mit Version und Zweck dokumentieren
  2. Zugriffskontrolle — SSO + RBAC, kein anonymer Zugang
  3. Audit Trail — alle Prompts und Completions optional loggen (Opt-in)
  4. Update-Prozess — Modell-Updates wie Software-Deployments behandeln
  5. Backup — Modell-Gewichte sichern (Verfügbarkeit)

Citação

"Local AI." Open Cognition Commons Foundation. https://opencognitioncommons.org/pt/glossary/local-ai. CC-BY 4.0.
Metadados legíveis por máquina
{
  "@context": "https://schema.org",
  "@type": "DefinedTerm",
  "name": "Local AI",
  "description": "Local AI bezeichnet den Betrieb von KI-Modellen und -Diensten auf eigener, lokal kontrollierter Infrastruktur — im Gegensatz zur Nutzung externer Cloud-APIs. Alle Daten verbleiben in der eigenen Infrastruktur.\n",
  "url": "https://opencognitioncommons.org/pt/glossary/local-ai",
  "license": "https://creativecommons.org/licenses/by/4.0/",
  "alternateName": [
    "Local AI",
    "On-Premise AI",
    "Self-hosted AI",
    "lokale KI"
  ]
}

Curso disponível em learn.iio.space

Local AI with Ollama →