Regeln für den Umgang mit Daten im Unternehmen — wer darf was sehen, ändern, löschen.
Data Governance als Fundament von AI Governance: Datenqualität (Completeness, Consistency, Accuracy), Datenkatalog, Lineage-Tracking, Access Control (RBAC/ABAC). EU AI Act Art. 10 verlangt Data Governance für Trainingsdaten von Hochrisiko-KI.
Definition
Data Governance stellt sicher, dass Daten in einer Organisation:
- Verfügbar sind — zur richtigen Zeit, für die richtigen Personen
- Qualitativ sind — korrekt, vollständig, aktuell
- Sicher sind — vor unbefugtem Zugriff geschützt
- Konform verwendet werden — nach DSGVO, internen Policies
Data Governance für KI
EU AI Act Art. 10 schreibt für Hochrisiko-KI explizit vor:
| Anforderung | Beschreibung |
|---|---|
| Relevanz | Daten müssen für den KI-Zweck geeignet sein |
| Repräsentativität | Abdeckung aller relevanten Gruppen |
| Fehlerfreiheit | Systematische Fehler identifizieren und korrigieren |
| Vollständigkeit | Fehlende Werte behandeln |
| Bias-Prüfung | Diskriminierende Muster erkennen |
| Datenlücken | Identifizieren und Auswirkungen bewerten |
Data Governance Rollen
| Rolle | Verantwortlichkeit |
|---|---|
| Data Owner | Verantwortlich für Datenqualität in seinem Bereich |
| Data Steward | Operative Datenpflege, Qualitätskontrollen |
| Data Engineer | Technische Dateninfrastruktur |
| Chief Data Officer | Strategische Data Governance |
| DPO (Datenschutzbeauftragter) | DSGVO-Compliance |
Data Catalog
Kernwerkzeug der Data Governance:
dataset:
id: "training-data-credit-scoring-v2"
owner: "team-fintech"
purpose: "Kreditwürdigkeitsbewertung"
source: "Transaktionsdaten 2020-2024"
personal_data: true
special_categories: false
bias_assessment: "completed-2024-03"
retention: "3 Jahre nach Modell-Retirement"
license: "internal"
last_quality_check: "2024-12"
Data Lineage
Nachvollziehbarkeit woher Daten stammen und wie sie transformiert wurden — besonders wichtig für KI-Audit und DSGVO Art. 5 (Rechenschaftspflicht):
Rohdaten → Preprocessing → Feature Engineering → Training → Modell
↑ ↑ ↑ ↑
Dokumentiert Dokumentiert Dokumentiert Model Card
Data Governance und Bias
Schlechte Data Governance ist die häufigste Ursache für KI-Bias:
- Nicht-repräsentative Stichproben
- Historische Diskriminierungsmuster in Daten
- Fehlende Dokumentation von Datenquellen
Konsequenz: Data Governance ist Fairness-Voraussetzung.
Citação
"Data Governance." Open Cognition Commons Foundation. https://opencognitioncommons.org/pt/glossary/data-governance. CC-BY 4.0. Metadados legíveis por máquina
{
"@context": "https://schema.org",
"@type": "DefinedTerm",
"name": "Data Governance",
"description": "Data Governance bezeichnet das Rahmenwerk aus Prozessen, Rollen, Standards und Metriken, das sicherstellt, dass Daten einer Organisation verfügbar, korrekt, sicher und konform genutzt werden.\n",
"url": "https://opencognitioncommons.org/pt/glossary/data-governance",
"license": "https://creativecommons.org/licenses/by/4.0/",
"alternateName": [
"Data Governance",
"Datengouvernanz",
"Data Management"
]
}