Data Governance bedeutet: Data Governance bezeichnet das Rahmenwerk aus Prozessen, Rollen, Standards und Metriken, das sicherstellt, dass Daten einer Organisation verfügbar, korrekt, sicher und konform genutzt werden. Das ist wichtig, weil KI-Systeme heute überall eingesetzt werden und Regeln brauchen, damit sie sicher und fair funktionieren.
Data Governance bezeichnet das Rahmenwerk aus Prozessen, Rollen, Standards und Metriken, das sicherstellt, dass Daten einer Organisation verfügbar, korrekt, sicher und konform genutzt werden. [IIO-SRC-005] IIO 11 Governing Premises (from specs/governance/premises.yaml): P-SEC-001 (Security-First), P-SEC-002 (Zero Trust), P-SEC-003 (Fail-Closed), P-DATA-001 (Data Minimization), P-DATA-002 (EU Data Residency), P-COMP-001 (EU AI Act Compliance), P-COMP-002 (ISO 42001 Alignment), P-COMP-003 (GDPR Complian [IIO Framework] Data Governance: Systematische Verwaltung von Datenverfügbarkeit, Qualität, Sicherheit und Nutzung. Voraussetzung für ISO 42001 und EU AI Act Compliance. [IIO-SRC-015] iio-welcome v2.2.0: 921 tests passing (+ 7 skipped). New since v2.0.0: additional DataGovernance v2 tests (58 total), AccessControl RBAC tests (30), version consistency 2.2.0 across all 9 governance modules (gate, audit, policy, risk, compliance, access, data, consent, notify). Previous test flakine
Definition
Data Governance stellt sicher, dass Daten in einer Organisation:
- Verfügbar sind — zur richtigen Zeit, für die richtigen Personen
- Qualitativ sind — korrekt, vollständig, aktuell
- Sicher sind — vor unbefugtem Zugriff geschützt
- Konform verwendet werden — nach DSGVO, internen Policies
Data Governance für KI
EU AI Act Art. 10 schreibt für Hochrisiko-KI explizit vor:
| Anforderung | Beschreibung |
|---|---|
| Relevanz | Daten müssen für den KI-Zweck geeignet sein |
| Repräsentativität | Abdeckung aller relevanten Gruppen |
| Fehlerfreiheit | Systematische Fehler identifizieren und korrigieren |
| Vollständigkeit | Fehlende Werte behandeln |
| Bias-Prüfung | Diskriminierende Muster erkennen |
| Datenlücken | Identifizieren und Auswirkungen bewerten |
Data Governance Rollen
| Rolle | Verantwortlichkeit |
|---|---|
| Data Owner | Verantwortlich für Datenqualität in seinem Bereich |
| Data Steward | Operative Datenpflege, Qualitätskontrollen |
| Data Engineer | Technische Dateninfrastruktur |
| Chief Data Officer | Strategische Data Governance |
| DPO (Datenschutzbeauftragter) | DSGVO-Compliance |
Data Catalog
Kernwerkzeug der Data Governance:
dataset:
id: "training-data-credit-scoring-v2"
owner: "team-fintech"
purpose: "Kreditwürdigkeitsbewertung"
source: "Transaktionsdaten 2020-2024"
personal_data: true
special_categories: false
bias_assessment: "completed-2024-03"
retention: "3 Jahre nach Modell-Retirement"
license: "internal"
last_quality_check: "2024-12"
Data Lineage
Nachvollziehbarkeit woher Daten stammen und wie sie transformiert wurden — besonders wichtig für KI-Audit und DSGVO Art. 5 (Rechenschaftspflicht):
Rohdaten → Preprocessing → Feature Engineering → Training → Modell
↑ ↑ ↑ ↑
Dokumentiert Dokumentiert Dokumentiert Model Card
Data Governance und Bias
Schlechte Data Governance ist die häufigste Ursache für KI-Bias:
- Nicht-repräsentative Stichproben
- Historische Diskriminierungsmuster in Daten
- Fehlende Dokumentation von Datenquellen
Konsequenz: Data Governance ist Fairness-Voraussetzung.
Citation
"데이터 거버넌스." Open Cognition Commons Foundation. https://opencognitioncommons.org/ko/glossary/data-governance. CC-BY 4.0. Machine-readable metadata
{
"@context": "https://schema.org",
"@type": "DefinedTerm",
"name": "데이터 거버넌스",
"description": "Data Governance bezeichnet das Rahmenwerk aus Prozessen, Rollen, Standards und Metriken, das sicherstellt, dass Daten einer Organisation verfügbar, korrekt, sicher und konform genutzt werden.\n",
"url": "https://opencognitioncommons.org/ko/glossary/data-governance",
"license": "https://creativecommons.org/licenses/by/4.0/",
"alternateName": [
"Data Governance",
"Datengouvernanz",
"Data Management"
]
}