Erklärbarkeit bedeutet: Ein Mensch kann verstehen warum eine KI so entschieden hat.
Global vs. Local Explainability. SHAP (Shapley Values, spieltheoretisch exakt), LIME (lokale lineare Approximation). Post-hoc vs. Ante-hoc (inherently interpretable models). EU AI Act Art. 13 fordert Explainability für Hochrisiko-KI-Ausgaben.
Definition
Explainability (Erklärbarkeit) ist die Fähigkeit eines KI-Systems, verständliche Erklärungen für seine Ausgaben zu liefern — so dass:
- Betroffene verstehen warum eine Entscheidung getroffen wurde
- Entwickler Fehler und Bias identifizieren können
- Auditoren Compliance prüfen können
- Nutzer der KI vertrauen oder widersprechen können
Explainability vs. Interpretability
Diese Begriffe werden oft verwechselt:
| Begriff | Fokus | Zielgruppe | Frage |
|---|---|---|---|
| Interpretability | Modell-Inneres verstehen | Entwickler, Forscher | Wie funktioniert das Modell intern? |
| Explainability | Ausgaben erklären | Nutzer, Betroffene | Warum diese Entscheidung? |
| Transparency | Offenlegung von Nutzung | Öffentlichkeit, Regulatoren | Wird KI genutzt? |
EU AI Act — Explainability-Anforderungen
Art. 13 Abs. 1 (Hochrisiko-KI)
KI-Systeme mit hohem Risiko werden so konzipiert und entwickelt, dass ihr Betrieb hinreichend transparent ist, damit die Betreiber die Ausgaben des Systems interpretieren und angemessen nutzen können.
Art. 14 Abs. 4 (Human Oversight)
Das Personal, das für die Überwachung zuständig ist, muss in der Lage sein, die Ausgaben des KI-Systems zu interpretieren.
DSGVO Art. 22 Abs. 3
Bei automatisierten Einzelentscheidungen: Betroffene haben Anspruch auf “aussagekräftige Informationen über die involvierte Logik”.
XAI-Methoden
Modell-agnostische Post-hoc Methoden
| Methode | Beschreibung | Ausgabe |
|---|---|---|
| SHAP | Shapley-Werte, Beiträge jedes Features | Feature Importance |
| LIME | Lokale lineare Approximation | Erklärung pro Vorhersage |
| Counterfactual | ”Was wäre wenn…” | Minimale Änderung zum anderen Ergebnis |
| Saliency Maps | Wichtige Bildbereiche | Heatmap für Bildklassifizierung |
Intrinsisch erklärbare Modelle
| Modell | Erklärbarkeit | Trade-off |
|---|---|---|
| Entscheidungsbaum | Hoch | Niedrige Leistung bei Komplexität |
| Lineare Regression | Hoch | Keine nicht-linearen Muster |
| Regelbasierte Systeme | Sehr hoch | Manueller Aufwand |
| Neuronales Netz | Niedrig | Hohe Leistung |
Praktische Umsetzung für Hochrisiko-KI
- Model Card erstellen — Zweck, Grenzen, bekannte Bias
- SHAP/LIME integrieren — Feature-Importance pro Entscheidung
- Erklärungsschnittstelle — Betroffene erhalten verständliche Begründung
- Counterfactual-Erklärungen — “Um X zu erreichen, müsste Y geändert werden”
- Audit Log — Erklärungen persistent speichern (Art. 12 EU AI Act)
Grenzen der Explainability
- Komplexitäts-Genauigkeits-Trade-off — einfachste Erklärungen sind oft unvollständig
- Adversarielle Erklärungen — manipulierte SHAP-Werte sind möglich
- Nutzer-Verständnis — technische Erklärungen oft nicht verständlich für Laien
- Kein Kausalitätsnachweis — Korrelationen in Erklärungen ≠ Kausalität
Citação
"Explainability (AI)." Open Cognition Commons Foundation. https://opencognitioncommons.org/pt/glossary/explainability. CC-BY 4.0. Metadados legíveis por máquina
{
"@context": "https://schema.org",
"@type": "DefinedTerm",
"name": "Explainability (AI)",
"description": "Explainability (Erklärbarkeit) bezeichnet die Fähigkeit eines KI-Systems, seine Entscheidungen, Vorhersagen oder Empfehlungen so zu kommunizieren, dass die betroffenen Personen diese nachvollziehen, hinterfragen und anfechten können.\n",
"url": "https://opencognitioncommons.org/pt/glossary/explainability",
"license": "https://creativecommons.org/licenses/by/4.0/",
"alternateName": [
"Explainability",
"XAI",
"Erklärbarkeit",
"Explainable AI"
]
}