Zum Hauptinhalt springen
OCC Pillar 2 · Das offene AI-Governance-Sprachmodell

compliance-qwen

Qwen2.5-7B · QLoRA · Apache-2.0 · EU-gehostet

Das erste offene, reproduzierbare, EU-gehostete Sprachmodell für AI Governance. QLoRA-finetuned auf dem OCC Corpus — kein proprietäres Daten, kein Cloud-Training, Apache-2.0 lizenziert.

🔄 In Entwicklung Geplant: Q4 2026

Technische Spezifikation

base Qwen/Qwen2.5-7B-Instruct
method QLoRA (rank=64, alpha=128)
data 689 Chunks aus 26 verifizierten Quellen
training pairs 241
license Apache-2.0 (Base) + CC-BY 4.0 (Daten)
compute IIO AI Hub — RTX PRO 6000 (96GB VRAM)
target Q4 2026

Entwicklungsfortschritt

5/11 Meilensteine · 45%

OCC Corpus (689 Chunks aus 26 Quellen)
Eval-Sets (50 Fragen, 7 Kategorien)
Red-Team-Playbook (7 Szenarien, 8 Gates)
chunks-to-training.py (241 Alpaca-Paare)
train_lora.py (QLoRA, dry-run OK)
Pilot-Training-Run (1 Epoche)
Eval: Grade B+ (pass_rate ≥ 0.65)
Red-Team: alle 8 Gates grün
Model Card + System Card
Hugging Face Upload (HITL)
LiteLLM Integration (als "compliance-qwen")

Trainingsdaten

compliance-qwen wird ausschließlich auf verifizierten Public-Domain-Quellen und dem IIO Framework (Apache-2.0) trainiert. Keine proprietären Daten, keine Urheberrechtsverletzungen, keine personenbezogenen Daten.

241 Alpaca-Format-Paare aus 689 Chunks generiert
2 Strategien Definition + Erklärung
DE/EN Sprache Deutsch primär
Public Domain + Apache-2.0 Lizenzen 100% verifiziert

Safety & Evaluation

Kein Release ohne alle 8 Safety-Gates. Das OCC Eval & Safety Lab prüft vor jeder Veröffentlichung:

RT-001 Jailbreak-Schutz 0 Erfolge in 20 Versuchen
RT-002 PII-Schutz Keine extrahierbaren Personendaten
RT-003 MCP-Scope 100% Tool-Scope enforced
RT-004 Rate-Limit Burst-Test bestanden
RT-005 CBRN-Schutz 0 schädliche Antworten
RT-006 Halluzination <10% auf Eval-Set
RT-007 Attribution 100% Quellenangaben
RT-008 Eval-Grade ≥ Grade B (pass_rate ≥ 0.65)

Aktuell verfügbar: OCC KI-Assistent

Während compliance-qwen in Entwicklung ist, steht der OCC KI-Assistent zur Verfügung — grounded auf 689 Chunks, EU-gehostet, anonym nutzbar.