メインコンテンツへスキップ
← Glossary
concept

Explainability (AI)

Explainability · XAI · Erklärbarkeit · Explainable AI

1 min May 19, 2026
Explainability (Erklärbarkeit) bezeichnet die Fähigkeit eines KI-Systems, seine Entscheidungen, Vorhersagen oder Empfehlungen so zu kommunizieren, dass die betroffenen Personen diese nachvollziehen, hinterfragen und anfechten können.
🟢 Plain Language

Erklärbarkeit bedeutet: Ein Mensch kann verstehen warum eine KI so entschieden hat.

🔵 Expert Level

Global vs. Local Explainability. SHAP (Shapley Values, spieltheoretisch exakt), LIME (lokale lineare Approximation). Post-hoc vs. Ante-hoc (inherently interpretable models). EU AI Act Art. 13 fordert Explainability für Hochrisiko-KI-Ausgaben.

Definition

Explainability (Erklärbarkeit) ist die Fähigkeit eines KI-Systems, verständliche Erklärungen für seine Ausgaben zu liefern — so dass:

  • Betroffene verstehen warum eine Entscheidung getroffen wurde
  • Entwickler Fehler und Bias identifizieren können
  • Auditoren Compliance prüfen können
  • Nutzer der KI vertrauen oder widersprechen können

Explainability vs. Interpretability

Diese Begriffe werden oft verwechselt:

BegriffFokusZielgruppeFrage
InterpretabilityModell-Inneres verstehenEntwickler, ForscherWie funktioniert das Modell intern?
ExplainabilityAusgaben erklärenNutzer, BetroffeneWarum diese Entscheidung?
TransparencyOffenlegung von NutzungÖffentlichkeit, RegulatorenWird KI genutzt?

EU AI Act — Explainability-Anforderungen

Art. 13 Abs. 1 (Hochrisiko-KI)

KI-Systeme mit hohem Risiko werden so konzipiert und entwickelt, dass ihr Betrieb hinreichend transparent ist, damit die Betreiber die Ausgaben des Systems interpretieren und angemessen nutzen können.

Art. 14 Abs. 4 (Human Oversight)

Das Personal, das für die Überwachung zuständig ist, muss in der Lage sein, die Ausgaben des KI-Systems zu interpretieren.

DSGVO Art. 22 Abs. 3

Bei automatisierten Einzelentscheidungen: Betroffene haben Anspruch auf “aussagekräftige Informationen über die involvierte Logik”.

XAI-Methoden

Modell-agnostische Post-hoc Methoden

MethodeBeschreibungAusgabe
SHAPShapley-Werte, Beiträge jedes FeaturesFeature Importance
LIMELokale lineare ApproximationErklärung pro Vorhersage
Counterfactual”Was wäre wenn…”Minimale Änderung zum anderen Ergebnis
Saliency MapsWichtige BildbereicheHeatmap für Bildklassifizierung

Intrinsisch erklärbare Modelle

ModellErklärbarkeitTrade-off
EntscheidungsbaumHochNiedrige Leistung bei Komplexität
Lineare RegressionHochKeine nicht-linearen Muster
Regelbasierte SystemeSehr hochManueller Aufwand
Neuronales NetzNiedrigHohe Leistung

Praktische Umsetzung für Hochrisiko-KI

  1. Model Card erstellen — Zweck, Grenzen, bekannte Bias
  2. SHAP/LIME integrieren — Feature-Importance pro Entscheidung
  3. Erklärungsschnittstelle — Betroffene erhalten verständliche Begründung
  4. Counterfactual-Erklärungen — “Um X zu erreichen, müsste Y geändert werden”
  5. Audit Log — Erklärungen persistent speichern (Art. 12 EU AI Act)

Grenzen der Explainability

  • Komplexitäts-Genauigkeits-Trade-off — einfachste Erklärungen sind oft unvollständig
  • Adversarielle Erklärungen — manipulierte SHAP-Werte sind möglich
  • Nutzer-Verständnis — technische Erklärungen oft nicht verständlich für Laien
  • Kein Kausalitätsnachweis — Korrelationen in Erklärungen ≠ Kausalität

引用

"Explainability (AI)." Open Cognition Commons Foundation. https://opencognitioncommons.org/ja/glossary/explainability. CC-BY 4.0.
機械可読メタデータ
{
  "@context": "https://schema.org",
  "@type": "DefinedTerm",
  "name": "Explainability (AI)",
  "description": "Explainability (Erklärbarkeit) bezeichnet die Fähigkeit eines KI-Systems, seine Entscheidungen, Vorhersagen oder Empfehlungen so zu kommunizieren, dass die betroffenen Personen diese nachvollziehen, hinterfragen und anfechten können.\n",
  "url": "https://opencognitioncommons.org/ja/glossary/explainability",
  "license": "https://creativecommons.org/licenses/by/4.0/",
  "alternateName": [
    "Explainability",
    "XAI",
    "Erklärbarkeit",
    "Explainable AI"
  ]
}

learn.iio.spaceでコースが利用可能

AI Bias & Fairness →