Eine spezielle Datei auf Webseiten die KI-Systemen erklärt was auf der Seite steht und wie sie den Inhalt nutzen dürfen.
llms.txt-Standard (llmstxt.org): Markdown-Datei im Root-Verzeichnis mit strukturierten Metadaten für AI-Crawler. Felder: name, url, description, license, ai_crawlers, llm_training, api_base. OCC-Implementierung: dynamisch generiert von Astro, listet alle 120 Glossarterme, deklariert CC-BY 4.0 Training-Erlaubnis. Ergänzt robots.txt für AI-spezifische Direktiven.
Definition
llms.txt ist eine Textdatei unter https://domain.tld/llms.txt, die
nach dem gleichnamigen Standard (llmstxt.org, 2024) strukturierte Metadaten
für KI-Systeme bereitstellt.
Analog zu:
robots.txt→ Crawl-Direktiven für Suchmaschinenhumans.txt→ Informationen für menschliche Besucherllms.txt→ Informationen für KI-Systeme
Aufbau
# Site Name — llms.txt
## Site Overview
name: Organisation Name
url: https://domain.tld
description: Kurzbeschreibung
license: CC-BY-4.0
ai_crawlers: allowed
llm_training: allowed
## Key URLs
- Homepage: https://domain.tld/
- API: https://domain.tld/api/
## Citation Guidance
Empfohlene Zitierformatierung...
Warum llms.txt?
Problem ohne llms.txt
KI-Systeme müssen die Struktur einer Site aus HTML/Meta-Tags erraten:
- Unstrukturiert, fehleranfällig
- Keine expliziten Nutzungsrechte
- Kein klarer Einstiegspunkt für Agenten
Mit llms.txt
- Explizite Freigabe —
ai_crawlers: allowed,llm_training: allowed - Strukturierte Übersicht — Wichtigste Ressourcen direkt abrufbar
- Zitierhinweise — Korrekte Attribution für LLM-Outputs
- API-Discovery — Direkter Hinweis auf maschinenlesbare Schnittstellen
Verhältnis zu robots.txt
| Datei | Zweck | Format |
|---|---|---|
robots.txt | Crawl-Regeln für Suchmaschinen | Key-Value |
llms.txt | Metadaten für KI-Systeme | Markdown |
sitemap.xml | URL-Übersicht für Crawler | XML |
Empfehlung: Alle drei gemeinsam implementieren für maximale GEO/AEO-Sichtbarkeit.
OCC llms.txt
OCC implementiert llms.txt vollständig mit:
- 82 Glossar-URLs direkt verlinkt
- API Quick Reference (Endpunkte, kein Auth)
- CC-BY 4.0 Freigabe für Training und Zitierung
- Generierungsdatum für Aktualitätsprüfung
Abrufbar: https://opencognitioncommons.org/llms.txt
引用
"llms.txt." Open Cognition Commons Foundation. https://opencognitioncommons.org/ja/glossary/llms-txt. CC-BY 4.0. 機械可読メタデータ
{
"@context": "https://schema.org",
"@type": "DefinedTerm",
"name": "llms.txt",
"description": "llms.txt ist ein Webstandard der eine Textdatei im Root-Verzeichnis einer Domain definiert, die KI-Systemen (LLMs, AI-Crawlern, Agenten) strukturierte Informationen über die Website und ihre Inhalte bereitstellt.\n",
"url": "https://opencognitioncommons.org/ja/glossary/llms-txt",
"license": "https://creativecommons.org/licenses/by/4.0/",
"alternateName": [
"llms.txt",
"llms-txt"
]
}