🟢 Plain Language
Künstlich erzeugte Daten die echten ähneln — nützlich zum KI-Training wenn echte Daten fehlen oder zu sensibel sind.
🔵 Expert Level
Synthetic Data-Generierung: Statistical Methods (SMOTE für Oversampling), GAN-basiert (StyleGAN für Bilder, TabGAN für tabellarische Daten), LLM-basiert (augmentierte Trainingsdaten). Datenschutzvorteil: keine personenbezogenen Echndaten. DSGVO-Status: synthetische Daten können noch personenbezogen sein wenn Re-Identifikation möglich. EU AI Act Art. 10: synthetische Daten als Option für Trainings-Daten-Governance.
Definition
Kuenstlich generierte Daten ohne echte Personenbezuege fuer KI-Training.
Detaillierte Dokumentation folgt in einem späteren Release.
Cytowanie
"Synthetic Data." Open Cognition Commons Foundation. https://opencognitioncommons.org/pl/glossary/synthetic-data. CC-BY 4.0. Metadane czytelne maszynowo
{
"@context": "https://schema.org",
"@type": "DefinedTerm",
"name": "Synthetic Data",
"description": "Kuenstlich generierte Daten ohne echte Personenbezuege fuer KI-Training.\n",
"url": "https://opencognitioncommons.org/pl/glossary/synthetic-data",
"license": "https://creativecommons.org/licenses/by/4.0/"
}