🟢 Plain Language
Gezieltes Testen von KI-Systemen durch Angriffe und Missbrauchsversuche — um Schwachstellen zu finden bevor echte Angreifer sie finden.
🔵 Expert Level
Red Teaming für KI: adversariales Testen auf Jailbreaks, Prompt Injection, Daten-Extraktion, Bias-Exploitation. EU AI Act Art. 55(1)(a): Pflicht für GPAI-Modelle mit systemischem Risiko. NIST AI RMF MEASURE 2.5: adversariales Testing als Measurement-Practice. Methoden: automated red teaming (AdvBench, HarmBench), human red teaming, structured elicitation.
Definition
Strukturierte Angriffssimulation zur Erkennung von Schwachstellen in KI-Systemen.
Detaillierte Dokumentation folgt in einem späteren Release.
引用
"Red Teaming (AI)." Open Cognition Commons Foundation. https://opencognitioncommons.org/ja/glossary/red-teaming. CC-BY 4.0. 機械可読メタデータ
{
"@context": "https://schema.org",
"@type": "DefinedTerm",
"name": "Red Teaming (AI)",
"description": "Strukturierte Angriffssimulation zur Erkennung von Schwachstellen in KI-Systemen.\n",
"url": "https://opencognitioncommons.org/ja/glossary/red-teaming",
"license": "https://creativecommons.org/licenses/by/4.0/"
}