Ir para o conteúdo principal
← Glossary
technology

llms.txt

llms.txt · llms-txt

1 min May 19, 2026
llms.txt ist ein Webstandard der eine Textdatei im Root-Verzeichnis einer Domain definiert, die KI-Systemen (LLMs, AI-Crawlern, Agenten) strukturierte Informationen über die Website und ihre Inhalte bereitstellt.
🟢 Plain Language

Eine spezielle Datei auf Webseiten die KI-Systemen erklärt was auf der Seite steht und wie sie den Inhalt nutzen dürfen.

🔵 Expert Level

llms.txt-Standard (llmstxt.org): Markdown-Datei im Root-Verzeichnis mit strukturierten Metadaten für AI-Crawler. Felder: name, url, description, license, ai_crawlers, llm_training, api_base. OCC-Implementierung: dynamisch generiert von Astro, listet alle 120 Glossarterme, deklariert CC-BY 4.0 Training-Erlaubnis. Ergänzt robots.txt für AI-spezifische Direktiven.

Definition

llms.txt ist eine Textdatei unter https://domain.tld/llms.txt, die nach dem gleichnamigen Standard (llmstxt.org, 2024) strukturierte Metadaten für KI-Systeme bereitstellt.

Analog zu:

  • robots.txt → Crawl-Direktiven für Suchmaschinen
  • humans.txt → Informationen für menschliche Besucher
  • llms.txt → Informationen für KI-Systeme

Aufbau

# Site Name — llms.txt

## Site Overview

name: Organisation Name
url: https://domain.tld
description: Kurzbeschreibung
license: CC-BY-4.0
ai_crawlers: allowed
llm_training: allowed

## Key URLs

- Homepage: https://domain.tld/
- API: https://domain.tld/api/

## Citation Guidance

Empfohlene Zitierformatierung...

Warum llms.txt?

Problem ohne llms.txt

KI-Systeme müssen die Struktur einer Site aus HTML/Meta-Tags erraten:

  • Unstrukturiert, fehleranfällig
  • Keine expliziten Nutzungsrechte
  • Kein klarer Einstiegspunkt für Agenten

Mit llms.txt

  • Explizite Freigabeai_crawlers: allowed, llm_training: allowed
  • Strukturierte Übersicht — Wichtigste Ressourcen direkt abrufbar
  • Zitierhinweise — Korrekte Attribution für LLM-Outputs
  • API-Discovery — Direkter Hinweis auf maschinenlesbare Schnittstellen

Verhältnis zu robots.txt

DateiZweckFormat
robots.txtCrawl-Regeln für SuchmaschinenKey-Value
llms.txtMetadaten für KI-SystemeMarkdown
sitemap.xmlURL-Übersicht für CrawlerXML

Empfehlung: Alle drei gemeinsam implementieren für maximale GEO/AEO-Sichtbarkeit.

OCC llms.txt

OCC implementiert llms.txt vollständig mit:

  • 82 Glossar-URLs direkt verlinkt
  • API Quick Reference (Endpunkte, kein Auth)
  • CC-BY 4.0 Freigabe für Training und Zitierung
  • Generierungsdatum für Aktualitätsprüfung

Abrufbar: https://opencognitioncommons.org/llms.txt

Citação

"llms.txt." Open Cognition Commons Foundation. https://opencognitioncommons.org/pt/glossary/llms-txt. CC-BY 4.0.
Metadados legíveis por máquina
{
  "@context": "https://schema.org",
  "@type": "DefinedTerm",
  "name": "llms.txt",
  "description": "llms.txt ist ein Webstandard der eine Textdatei im Root-Verzeichnis einer Domain definiert, die KI-Systemen (LLMs, AI-Crawlern, Agenten) strukturierte Informationen über die Website und ihre Inhalte bereitstellt.\n",
  "url": "https://opencognitioncommons.org/pt/glossary/llms-txt",
  "license": "https://creativecommons.org/licenses/by/4.0/",
  "alternateName": [
    "llms.txt",
    "llms-txt"
  ]
}