🟢 Plain Language

Gezieltes Testen von KI-Systemen durch Angriffe und Missbrauchsversuche — um Schwachstellen zu finden bevor echte Angreifer sie finden.

🔵 Expert Level

Red Teaming für KI: adversariales Testen auf Jailbreaks, Prompt Injection, Daten-Extraktion, Bias-Exploitation. EU AI Act Art. 55(1)(a): Pflicht für GPAI-Modelle mit systemischem Risiko. NIST AI RMF MEASURE 2.5: adversariales Testing als Measurement-Practice. Methoden: automated red teaming (AdvBench, HarmBench), human red teaming, structured elicitation.

Definition

Strukturierte Angriffssimulation zur Erkennung von Schwachstellen in KI-Systemen.

Detaillierte Dokumentation folgt in einem späteren Release.

引用

"Red Teaming (AI)." Open Cognition Commons Foundation. https://opencognitioncommons.org/ja/glossary/red-teaming. CC-BY 4.0.

機械可読メタデータ

{
  "@context": "https://schema.org",
  "@type": "DefinedTerm",
  "name": "Red Teaming (AI)",
  "description": "Strukturierte Angriffssimulation zur Erkennung von Schwachstellen in KI-Systemen.\n",
  "url": "https://opencognitioncommons.org/ja/glossary/red-teaming",
  "license": "https://creativecommons.org/licenses/by/4.0/"
}