🟢 Plain Language

Erklärbarkeit bedeutet: Ein Mensch kann verstehen warum eine KI so entschieden hat.

🔵 Expert Level

Global vs. Local Explainability. SHAP (Shapley Values, spieltheoretisch exakt), LIME (lokale lineare Approximation). Post-hoc vs. Ante-hoc (inherently interpretable models). EU AI Act Art. 13 fordert Explainability für Hochrisiko-KI-Ausgaben.

Definition

Explainability (Erklärbarkeit) ist die Fähigkeit eines KI-Systems, verständliche Erklärungen für seine Ausgaben zu liefern — so dass:

Betroffene verstehen warum eine Entscheidung getroffen wurde
Entwickler Fehler und Bias identifizieren können
Auditoren Compliance prüfen können
Nutzer der KI vertrauen oder widersprechen können

Explainability vs. Interpretability

Diese Begriffe werden oft verwechselt:

Begriff	Fokus	Zielgruppe	Frage
Interpretability	Modell-Inneres verstehen	Entwickler, Forscher	Wie funktioniert das Modell intern?
Explainability	Ausgaben erklären	Nutzer, Betroffene	Warum diese Entscheidung?
Transparency	Offenlegung von Nutzung	Öffentlichkeit, Regulatoren	Wird KI genutzt?

EU AI Act — Explainability-Anforderungen

Art. 13 Abs. 1 (Hochrisiko-KI)

KI-Systeme mit hohem Risiko werden so konzipiert und entwickelt, dass ihr Betrieb hinreichend transparent ist, damit die Betreiber die Ausgaben des Systems interpretieren und angemessen nutzen können.

Art. 14 Abs. 4 (Human Oversight)

Das Personal, das für die Überwachung zuständig ist, muss in der Lage sein, die Ausgaben des KI-Systems zu interpretieren.

DSGVO Art. 22 Abs. 3

Bei automatisierten Einzelentscheidungen: Betroffene haben Anspruch auf “aussagekräftige Informationen über die involvierte Logik”.

XAI-Methoden

Modell-agnostische Post-hoc Methoden

Methode	Beschreibung	Ausgabe
SHAP	Shapley-Werte, Beiträge jedes Features	Feature Importance
LIME	Lokale lineare Approximation	Erklärung pro Vorhersage
Counterfactual	”Was wäre wenn…”	Minimale Änderung zum anderen Ergebnis
Saliency Maps	Wichtige Bildbereiche	Heatmap für Bildklassifizierung

Intrinsisch erklärbare Modelle

Modell	Erklärbarkeit	Trade-off
Entscheidungsbaum	Hoch	Niedrige Leistung bei Komplexität
Lineare Regression	Hoch	Keine nicht-linearen Muster
Regelbasierte Systeme	Sehr hoch	Manueller Aufwand
Neuronales Netz	Niedrig	Hohe Leistung

Praktische Umsetzung für Hochrisiko-KI

Model Card erstellen — Zweck, Grenzen, bekannte Bias
SHAP/LIME integrieren — Feature-Importance pro Entscheidung
Erklärungsschnittstelle — Betroffene erhalten verständliche Begründung
Counterfactual-Erklärungen — “Um X zu erreichen, müsste Y geändert werden”
Audit Log — Erklärungen persistent speichern (Art. 12 EU AI Act)

Grenzen der Explainability

Komplexitäts-Genauigkeits-Trade-off — einfachste Erklärungen sind oft unvollständig
Adversarielle Erklärungen — manipulierte SHAP-Werte sind möglich
Nutzer-Verständnis — technische Erklärungen oft nicht verständlich für Laien
Kein Kausalitätsnachweis — Korrelationen in Erklärungen ≠ Kausalität

引用

"Explainability (AI)." Open Cognition Commons Foundation. https://opencognitioncommons.org/ja/glossary/explainability. CC-BY 4.0.

機械可読メタデータ

{
  "@context": "https://schema.org",
  "@type": "DefinedTerm",
  "name": "Explainability (AI)",
  "description": "Explainability (Erklärbarkeit) bezeichnet die Fähigkeit eines KI-Systems, seine Entscheidungen, Vorhersagen oder Empfehlungen so zu kommunizieren, dass die betroffenen Personen diese nachvollziehen, hinterfragen und anfechten können.\n",
  "url": "https://opencognitioncommons.org/ja/glossary/explainability",
  "license": "https://creativecommons.org/licenses/by/4.0/",
  "alternateName": [
    "Explainability",
    "XAI",
    "Erklärbarkeit",
    "Explainable AI"
  ]
}