メインコンテンツへスキップ
← Glossary
concept

Red Teaming (AI)

1 min May 19, 2026
Strukturierte Angriffssimulation zur Erkennung von Schwachstellen in KI-Systemen.
🟢 Plain Language

Gezieltes Testen von KI-Systemen durch Angriffe und Missbrauchsversuche — um Schwachstellen zu finden bevor echte Angreifer sie finden.

🔵 Expert Level

Red Teaming für KI: adversariales Testen auf Jailbreaks, Prompt Injection, Daten-Extraktion, Bias-Exploitation. EU AI Act Art. 55(1)(a): Pflicht für GPAI-Modelle mit systemischem Risiko. NIST AI RMF MEASURE 2.5: adversariales Testing als Measurement-Practice. Methoden: automated red teaming (AdvBench, HarmBench), human red teaming, structured elicitation.

Definition

Strukturierte Angriffssimulation zur Erkennung von Schwachstellen in KI-Systemen.

Detaillierte Dokumentation folgt in einem späteren Release.

引用

"Red Teaming (AI)." Open Cognition Commons Foundation. https://opencognitioncommons.org/ja/glossary/red-teaming. CC-BY 4.0.
機械可読メタデータ
{
  "@context": "https://schema.org",
  "@type": "DefinedTerm",
  "name": "Red Teaming (AI)",
  "description": "Strukturierte Angriffssimulation zur Erkennung von Schwachstellen in KI-Systemen.\n",
  "url": "https://opencognitioncommons.org/ja/glossary/red-teaming",
  "license": "https://creativecommons.org/licenses/by/4.0/"
}