Wie LoRA funktioniert
Standard Fine-Tuning: Alle Gewichte des Modells werden trainiert → Teuer (GPU), langsam, viel Speicher
LoRA:
Original Gewichte W (eingefroren)
+
LoRA Matrizen A × B (trainierbar, klein)
=
W + A×B (effektiv neue Gewichte)
A und B sind niedrigrangige Matrizen — viel kleiner als das Originalmodell.
Vorteile
| Aspekt | Standard Fine-Tuning | LoRA |
|---|---|---|
| Trainierbare Parameter | 100% | 0.1–1% |
| GPU-Speicher | Viel | Wenig |
| Trainingszeit | Tage | Stunden |
| Qualität | Maximal | Annähernd gleich |
| Speicherplatz | Ganzes Modell | Nur Adapter (~MB) |
Anwendungen
- Stil-Training: Modell auf spezifischen Zeichenstil anpassen
- Charakter-Konsistenz: Immer gleiche Figuren in Bildgenerierung (IIO-Nutzung)
- Domänen-Anpassung: Modell auf Fachterminologie spezialisieren
- Sprach-Fine-Tuning: Bessere Leistung für spezifische Sprache
DSGVO und LoRA
LoRA-Adapter können auf sensiblen internen Daten trainiert werden:
- Training lokal (kein Cloud-Transfer)
- Adapter enthält kein direktes “Erinnern” der Trainingsdaten
- Aber: Membership Inference Attacks möglich → Datenschutzfolgenabschätzung empfohlen
引用
"LoRA (Low-Rank Adaptation)." Open Cognition Commons Foundation. https://opencognitioncommons.org/zh/glossary/lora. CC-BY 4.0. 机器可读元数据
{
"@context": "https://schema.org",
"@type": "DefinedTerm",
"name": "LoRA (Low-Rank Adaptation)",
"description": "LoRA (Low-Rank Adaptation) ist eine Parameter-effiziente Feinabstimmungs- methode für große KI-Modelle, die zusätzliche niedrigrangige Gewichtsmatrizen einfügt statt das gesamte Modell zu trainieren.\n",
"url": "https://opencognitioncommons.org/zh/glossary/lora",
"license": "https://creativecommons.org/licenses/by/4.0/",
"alternateName": [
"LoRA",
"Low-Rank Adaptation",
"PEFT"
]
}