llms.txt ist eine einfache Markdown-Datei, die du im Wurzelverzeichnis deiner Domain unter `/llms.txt` ablegst. Sie gibt KI-Modellen wie ChatGPT, Claude und Perplexity eine kuratierte Landkarte deiner wichtigsten Inhalte: eine kurze Beschreibung deiner Seite plus eine geordnete Liste von Links zu den Dokumenten, die ein KI-System lesen soll. Der Vorschlag stammt vom australischen Entwickler Jeremy Howard (Mitgruender von fast.ai und Answer.AI) und wurde im September 2024 veroeffentlicht.
Der Kerngedanke: KI-Systeme haben enge Kontextfenster und tun sich schwer damit, navigationslastige HTML-Seiten voller Menues, Skripte und Werbung zu verarbeiten. llms.txt liefert stattdessen sauberes, vorverdautes Markdown an einer vorhersehbaren Stelle. Dieser Guide erklaert, was die Datei genau ist, warum sie fuer die KI-Suche zunehmend zaehlt, wie du sie in klaren Schritten erstellst und worin sich `llms-full.txt` davon unterscheidet.
Was ist llms.txt?
llms.txt ist eine standardisierte Markdown-Datei unter `https://deine-domain.de/llms.txt`, die einem grossen Sprachmodell auf einen Blick zeigt, welche Inhalte deiner Website am wichtigsten sind und wo sie liegen. Sie ist bewusst maschinen- und menschenlesbar zugleich: keine komplexe Syntax, nur Markdown. Damit unterscheidet sie sich grundlegend von `robots.txt`, die in einem eigenen Format Crawler steuert, und von `sitemap.xml`, die in XML alle URLs auflistet.
Das Format folgt einer festen Struktur. An erster Stelle steht ein H1 mit dem Namen deines Projekts. Darunter ein kurzer Blockquote, der in ein bis zwei Saetzen erklaert, worum es geht. Es folgen optionale Detailabschnitte und dann ein oder mehrere H2-Abschnitte mit Linklisten im Format `[Titel](URL): kurze Notiz`. Ein optionaler Abschnitt `## Optional` markiert Inhalte, die ein Modell ueberspringen darf, wenn das Kontextfenster knapp wird.
Wichtig zur Einordnung: llms.txt ist ein Community-Vorschlag, kein offizieller Standard einer Normungsorganisation wie IETF oder W3C. Es ist eine Konvention, die sich durch Adaption verbreitet — aehnlich wie es `robots.txt` in seinen Anfangsjahren war.
Woher der Vorschlag stammt
Jeremy Howard, der den Vorschlag im September 2024 auf llmstxt.org veroeffentlichte, ist kein Unbekannter: Er gilt als einer der einflussreichsten Praktiker im Bereich angewandtes Deep Learning und hat mit fast.ai eine der meistgenutzten Lern-Communities fuer maschinelles Lernen aufgebaut. Sein Ausgangsproblem war konkret und praktisch. Beim Bau von KI-Tools fuer die eigene Doku stellte sein Team fest, dass Modelle an HTML-Seiten scheiterten — nicht weil der Inhalt fehlte, sondern weil er unter Layout, Skripten und Navigation begraben lag.
Die Loesung sollte bewusst minimal sein. Statt eines neuen, komplexen Protokolls griff Howard zu Markdown, das Sprachmodelle ohnehin exzellent verstehen, weil ein Grossteil ihrer Trainingsdaten in diesem Format vorliegt. Die Wahl des Dateinamens `llms.txt` und der festen Position im Domain-Root war eine bewusste Anlehnung an etablierte Konventionen wie `robots.txt` — vertraut, vorhersehbar und ohne Lernkurve fuer Entwickler. Genau diese Schlichtheit erklaert, warum sich der Vorschlag so schnell verbreitete.
Wie eine llms.txt-Datei aussieht
Eine minimale, gueltige llms.txt besteht aus vier Bausteinen. Hier ein konkretes Beispiel fuer eine fiktive Dokumentationsseite:
``` # Beispiel-Projekt
PromptEin Tool zum Organisieren und Versionieren von KI-Prompts.
Docs
- [Schnellstart](https://example.com/docs/quickstart.md): In 5 Minuten startklar
- [API-Referenz](https://example.com/docs/api.md): Alle Endpunkte erklaert
Optional
- [Changelog](https://example.com/changelog.md): Versionshistorie ```
Drei Designprinzipien stecken dahinter. Erstens Kuration: Du waehlst aus, statt alles abzuwerfen — das Gegenteil einer kompletten Sitemap. Zweitens Markdown: Jeder verlinkte Inhalt sollte idealerweise auch als `.md`-Version existieren, damit das Modell sauberen Text statt HTML bekommt. Drittens Prioritaet: Die Reihenfolge signalisiert Wichtigkeit, und `## Optional` erlaubt es Modellen, bei knappem Budget gezielt wegzulassen.
llms.txt vs. robots.txt vs. sitemap.xml
Die drei Dateien werden oft verwechselt, erfuellen aber verschiedene Zwecke. Eine kurze Gegenueberstellung schafft Klarheit:
| Datei | Format | Zweck | Zielgruppe |
|---|---|---|---|
| robots.txt | Eigenes Regelformat | Erlauben/Verbieten von Crawling | Such- und KI-Crawler |
| sitemap.xml | XML | Vollstaendige URL-Liste fuer Indexierung | Suchmaschinen-Crawler |
| llms.txt | Markdown | Kuratierte Inhalte fuer LLM-Inferenz | KI-Sprachmodelle |
Der entscheidende Unterschied: `robots.txt` und `sitemap.xml` richten sich an Crawler, die deine Seite indexieren. llms.txt richtet sich an Modelle, die deinen Inhalt zur Inferenzzeit lesen und in eine Antwort einbauen sollen. Tiefer gehen wir in [ai.txt vs. llms.txt vs. robots.txt](/de/magazin/ai-txt-vs-llms-txt-robots).
Warum ist llms.txt wichtig fuer die KI-Suche?
llms.txt ist wichtig, weil die Art, wie Menschen Informationen finden, sich verschiebt: weg von der klassischen blauen Linkliste, hin zu KI-generierten Antworten. Wenn ein Modell deine Inhalte sauber lesen und korrekt zitieren kann, steigt deine Chance, in genau diesen Antworten aufzutauchen. llms.txt senkt die Huerde dafuer, indem es Reibung beim Lesen entfernt.
Die Verschiebung ist messbar. Laut Gartner (Pressemitteilung, Februar 2024) wird das Volumen klassischer Suchanfragen ueber Suchmaschinen bis 2026 um rund 25 Prozent zurueckgehen, weil Nutzer zu KI-Chatbots und virtuellen Agenten abwandern. Parallel berichtet OpenAI, dass ChatGPT bis 2025 ueber 800 Millionen woechentlich aktive Nutzer erreicht hat (OpenAI, 2025). Diese Nutzer stellen Fragen, deren Antworten aus Webinhalten zusammengesetzt werden — und jede Inhaltsquelle, die schwer lesbar ist, wird seltener herangezogen.
Das Kontextfenster-Problem
Der technische Grund fuer llms.txt liegt im begrenzten Kontextfenster von Sprachmodellen. Ein Modell kann pro Anfrage nur eine endliche Menge Text verarbeiten. Eine typische HTML-Seite besteht aber zu einem grossen Teil aus Navigation, Skripten, Tracking, Cookie-Bannern und Werbung — Ballast, der das Budget verbraucht, ohne zur Antwort beizutragen.
llms.txt loest das, indem es vorverdautes Markdown bereitstellt: nur der relevante Inhalt, ohne Geruest. Das spart Token, reduziert das Risiko, dass das Modell den eigentlichen Inhalt "verliert", und erhoeht die Wahrscheinlichkeit einer korrekten, gut zitierten Antwort. Statt das Modell raten zu lassen, welcher Teil deiner Seite zaehlt, sagst du es ihm direkt.
Wer profitiert am meisten?
Nicht jede Website braucht llms.txt gleich dringend. Besonders profitieren Seiten, deren Wert in strukturiertem, faktischem Inhalt liegt:
- Software-Dokumentation: APIs, SDKs und Guides, die KI-Coding-Assistenten korrekt wiedergeben sollen.
- Wissensdatenbanken und Hilfe-Center: Support-Inhalte, die Chatbots fuer Antworten heranziehen.
- Produkt- und Preisseiten: Damit KI-Antworten deine Features und Konditionen richtig darstellen.
- Magazine und Fachblogs: Inhalte, die als zitierfaehige Quelle in KI-Antworten erscheinen sollen.
Reine Marketing-Landingpages mit wenig Substanz profitieren weniger. Der gemeinsame Nenner: Wenn du willst, dass KI deine Fakten korrekt wiedergibt, hilfst du ihr, diese Fakten sauber zu finden. Ein Beispiel macht es greifbar: Ein SaaS-Anbieter mit komplexer Preisstruktur riskiert, dass ein KI-Chatbot veraltete oder erfundene Konditionen nennt, wenn das Modell die Preisseite nur als verschachteltes HTML mit Tarif-Tabellen und JavaScript-Schaltern vorfindet. Eine klare, in der llms.txt verlinkte Markdown-Fassung der Preise reduziert genau dieses Risiko der Falschdarstellung spuerbar.
Ein ehrlicher Blick auf die Adaption
llms.txt ist kein Garant fuer Sichtbarkeit, und das sollte man offen sagen. Bis 2026 hat noch kein grosser Anbieter — weder OpenAI, Anthropic noch Google — oeffentlich bestaetigt, dass seine Modelle llms.txt zur Antwortgenerierung aktiv lesen. Google-Vertreter John Mueller aeusserte sich 2025 sogar skeptisch und verglich die Datei mit dem weitgehend ignorierten `keywords`-Meta-Tag.
Trotzdem hat die Konvention an Schwung gewonnen: Anbieter wie Anthropic, Stripe, Cloudflare und zahlreiche Dev-Tool-Firmen veroeffentlichen llms.txt-Dateien, und Verzeichnisse wie directory.llmstxt.cloud listen Tausende davon. Die pragmatische Einschaetzung fuer 2026: geringer Aufwand, kein Schaden, potenzieller Nutzen sobald mehr Tools die Datei nutzen — ein klassischer No-Regret-Schritt im Rahmen von [Generative Engine Optimization](/de/magazin/generative-engine-optimization-guide).
Wie KI-Systeme die Datei heute tatsaechlich nutzen
Auch wenn die grossen Modell-Anbieter llms.txt nicht automatisch beim Beantworten jeder Frage abrufen, wird die Datei bereits konkret genutzt — nur an anderer Stelle, als viele vermuten. Der haeufigste reale Anwendungsfall sind agentische Tools und IDE-Assistenten: Wenn ein Entwickler eine Doku-URL in Cursor, einen Coding-Agenten oder einen Custom-GPT laedt, koennen diese Werkzeuge gezielt nach `/llms.txt` suchen, um die saubere Markdown-Fassung statt des HTML-Geruests zu bekommen.
Ein zweiter Anwendungsfall ist manuelles Prompting: Nutzer fuegen den Inhalt einer `llms-full.txt` direkt in ein Modell mit grossem Kontextfenster ein, um Fragen zu einer ganzen Doku zu stellen. Drittens bauen RAG-Pipelines (Retrieval-Augmented Generation) zunehmend auf llms.txt als bevorzugte, vorgereinigte Quelle auf. Der gemeinsame Nenner: Die Datei zahlt sich heute vor allem dort aus, wo ein Mensch oder ein Agent bewusst entscheidet, deine Inhalte heranzuziehen — und sie genau dann sauber vorliegen.
Warum llms.txt kein Ersatz fuer gute Inhalte ist
Eine verbreitete Fehlannahme lautet, llms.txt sei ein Trick, der schwache Inhalte sichtbar macht. Das Gegenteil stimmt. Die Datei verbessert nur die Auffindbarkeit und Lesbarkeit von Inhalten, die ohnehin existieren — sie erzeugt keine Autoritaet und ersetzt weder Tiefe noch Aktualitaet. Ein Modell, das ueber deine llms.txt auf eine duenne, unbelegte Seite stoesst, wird diese Seite nicht haeufiger zitieren, nur weil sie als sauberes Markdown vorliegt. Im Gegenteil: Sauberes Markdown macht inhaltliche Schwaechen sogar sichtbarer, weil kein Layout sie kaschiert.
Die richtige Reihenfolge ist deshalb klar. Zuerst gute, zitierfaehige Inhalte mit klaren Antworten, Belegen und benannter Autorschaft — die Grundlagen, die der [GEO-Guide](/de/magazin/generative-engine-optimization-guide) ausfuehrlich beschreibt. Dann eine saubere robots.txt, damit KI-Crawler die Seite ueberhaupt abrufen duerfen. Und erst danach llms.txt als guenstige Zusatzoptimierung. Wer die Reihenfolge umdreht und mit der Discovery-Datei beginnt, optimiert ein Schaufenster fuer ein leeres Geschaeft.
Wie erstellst du eine llms.txt-Datei?
Eine llms.txt erstellst du in fuenf Schritten: wichtige Inhalte auswaehlen, die Datei nach dem Standardformat schreiben, optionale Markdown-Versionen der Zielseiten bereitstellen, die Datei im Domain-Root ablegen und das Ergebnis testen. Der gesamte Prozess dauert fuer eine kleinere Seite unter einer Stunde und kommt ohne Spezialsoftware aus.
Hier die Schritte im Detail:
1. Inhalte kuratieren. Liste die 10 bis 30 wichtigsten URLs deiner Seite: Doku, Kernprodukte, Preise, zentrale Guides. Frage dich bei jeder: "Soll eine KI das korrekt wiedergeben koennen?" 2. Datei schreiben. Beginne mit `# Projektname`, dann ein Blockquote als Zusammenfassung, dann H2-Abschnitte mit Linklisten im Format `[Titel](URL): Notiz`. 3. Markdown-Versionen bereitstellen. Lege idealerweise zu jeder Zielseite eine `.md`-Version an (z. B. `seite.html` und `seite.html.md`), damit Modelle reinen Text bekommen. 4. Im Root ablegen. Speichere die Datei als `llms.txt` unter der Wurzel, erreichbar unter `https://deine-domain.de/llms.txt` mit Content-Type `text/plain` oder `text/markdown`. 5. Testen. Rufe die URL im Browser auf, pruefe die Markdown-Syntax und gib einem KI-Modell den Link mit der Bitte, deine Seite zusammenzufassen.
Den Inhalt richtig kuratieren
Der wichtigste und am meisten unterschaetzte Schritt ist die Auswahl. llms.txt ist kein Abladeplatz fuer alle URLs — das waere eine Sitemap. Du triffst eine redaktionelle Entscheidung: Was muss eine KI ueber dich wissen, um dich korrekt zu repraesentieren? Halte die Liste fokussiert. Zehn perfekt ausgewaehlte Links sind wertvoller als zweihundert wahllose.
Strukturiere thematisch ueber H2-Abschnitte: etwa `## Docs`, `## Produkt`, `## Unternehmen`. Setze pro Link eine kurze, praezise Notiz hinter den Doppelpunkt — sie hilft dem Modell zu entscheiden, ob der Link zur Frage passt. Was nett, aber nicht essenziell ist, gehoert unter `## Optional`. So gibst du dem Modell eine klare Prioritaetenfolge fuer den Fall, dass nicht alles ins Kontextfenster passt.
Tools, die helfen
Du musst llms.txt nicht von Hand schreiben. Eine wachsende Werkzeuglandschaft hat sich 2025 etabliert:
- firecrawl.dev/llmstxt crawlt eine Domain und generiert sowohl `llms.txt` als auch `llms-full.txt` automatisch.
- llmstxt.firecrawl.dev und aehnliche Generatoren erzeugen einen Entwurf aus deiner Sitemap.
- CMS-Plugins fuer WordPress, Webflow und andere Systeme bieten zunehmend automatische llms.txt-Ausgabe.
- Static-Site-Generatoren wie Docusaurus, VitePress oder Mintlify koennen `.md`-Spiegelversionen deiner Seiten beim Build mit ausgeben.
Eine wichtige Warnung: Generierte Dateien sind ein Ausgangspunkt, kein Endergebnis. Ein Tool kennt nicht deine Prioritaeten. Pruefe und kuerze den Entwurf immer von Hand, sonst landest du wieder bei einer ungefilterten Linkliste — genau dem, was llms.txt vermeiden soll. Wer mehrere Discovery-Dateien parallel pflegt, findet die Abgrenzung in [ai.txt vs. llms.txt vs. robots.txt](/de/magazin/ai-txt-vs-llms-txt-robots).
Pruefen, ausliefern und aktuell halten
Nach dem Schreiben kommt der Teil, den die meisten unterschaetzen: korrekte Auslieferung und Pflege. Pruefe zuerst, dass die Datei wirklich unter `/llms.txt` erreichbar ist und mit dem richtigen Content-Type ausgeliefert wird — `text/plain` oder `text/markdown`. Ein haeufiger Fehler ist, dass die Datei vom Server als HTML oder mit einem 404 ausgeliefert wird, weil sie nicht im richtigen Verzeichnis liegt oder eine Routing-Regel sie abfaengt.
Ein praktischer End-zu-End-Test schlaegt jede Theorie: Gib einem Modell wie Claude oder ChatGPT den Link zu deiner `llms.txt` und bitte es, deine Website in fuenf Saetzen zusammenzufassen. Stimmt das Ergebnis, funktioniert die Datei. Stimmt es nicht, siehst du sofort, welche Inhalte fehlen oder missverstanden werden. Plane ausserdem ein, die Datei bei jedem groesseren Inhalts-Update mitzupflegen — am besten automatisiert im Build-Prozess, damit sie nie veraltet. Eine veraltete llms.txt ist schlechter als keine, weil sie KI-Systemen aktiv falsche Fakten liefert.
Ein konkreter Test-Prompt, der sich in der Praxis bewaehrt hat, lautet:
"Lies die Datei unter dieser URL und fasse in fuenf Saetzen zusammen, was dieses Produkt macht, fuer wen es ist und was es kostet."
Vergleiche die Antwort mit dem, was du selbst sagen wuerdest. Weicht sie ab, fehlt entweder eine wichtige Seite in deiner llms.txt oder eine Zielseite ist nicht sauber als Markdown lesbar. So wird der Test zur Diagnose: Er zeigt dir nicht nur, ob die Datei technisch funktioniert, sondern auch, ob deine Kuration die richtigen Inhalte priorisiert.
Was gehoert in llms-full.txt?
In `llms-full.txt` gehoert der gesamte Inhalt deiner wichtigen Seiten als ein einziges, langes Markdown-Dokument — nicht nur Links, sondern der ausgeschriebene Volltext. Waehrend `llms.txt` eine kompakte Landkarte mit Verweisen ist, ist `llms-full.txt` das vollstaendige Buch: ein Modell kann es in einem Zug einlesen, ohne jedem Link einzeln folgen zu muessen.
Der Unterschied ist grundlegend und betrifft den Anwendungsfall. `llms.txt` eignet sich, wenn ein Modell selektiv navigieren soll und Kontext knapp ist. `llms-full.txt` eignet sich, wenn ein Modell mit grossem Kontextfenster deine komplette Doku auf einmal aufnehmen soll — etwa ein Coding-Assistent, der deine gesamte API-Referenz im Speicher haben will. Anthropics eigene Doku stellt beide Varianten bereit; die `llms-full.txt` dort umfasst Hunderttausende Token.
Wann welche Datei?
Die Wahl haengt von Groesse und Zweck deiner Inhalte ab. Eine einfache Faustregel:
| Kriterium | llms.txt | llms-full.txt |
|---|---|---|
| Inhalt | Links + kurze Notizen | Kompletter Volltext |
| Groesse | Klein (wenige KB) | Gross (oft >100 KB) |
| Bester Fall | Selektive Navigation | Gesamte Doku auf einmal |
| Kontextbedarf | Niedrig | Hoch (grosses Fenster noetig) |
In der Praxis schliessen sich beide nicht aus. Viele Anbieter veroeffentlichen beide: `llms.txt` als kuratierten Einstieg und `llms-full.txt` als vollstaendige Wissensbasis. Generatoren wie Firecrawl erzeugen ebenfalls beide parallel. Fuer kleinere Websites reicht oft `llms.txt` allein; ab einer umfangreichen Doku lohnt sich die Volltextvariante zusaetzlich.
Ein nuetzliches Muster aus der Praxis: Verlinke deine `llms-full.txt` als optionalen Eintrag in der `llms.txt`. So findet ein Modell zuerst die kompakte Landkarte und kann bei Bedarf gezielt zum Volltext greifen. Achte aber auf die Groesse — eine `llms-full.txt` mit mehreren Hunderttausend Token passt nicht in jedes Kontextfenster und sollte daher nie als Pflichtinhalt der kuratierten Datei gelten, sondern stets als ergaenzendes Angebot fuer Modelle, die den Platz haben.
Haeufige Fehler vermeiden
Beim Erstellen beider Dateien tauchen immer wieder dieselben Fehler auf. Vermeide diese:
- HTML statt Markdown abladen. llms-full.txt soll sauberes Markdown sein, kein kopiertes HTML mit Tags und Skripten.
- Veraltete Inhalte einfrieren. Die Datei muss bei Inhaltsaenderungen mit aktualisiert werden, sonst zitiert die KI veraltete Fakten. Automatisiere die Generierung im Build.
- Sensibles versehentlich exponieren. Alles in der Datei ist oeffentlich lesbar. Keine internen URLs, Tokens oder Entwuerfe aufnehmen.
- Die Datei mit der Sitemap verwechseln. llms-full.txt ist Inhalt, keine URL-Liste — und `llms.txt` ist Kuration, keine Vollstaendigkeit.
Behandle beide Dateien wie einen Teil deiner Inhalte, nicht wie eine einmalige Konfiguration. Aktuell gehalten und ehrlich kuratiert, sind sie ein guenstiger Baustein deiner KI-Sichtbarkeit — eingebettet in eine groessere [GEO-Strategie](/magazin/generative-engine-optimization-guide).
Fazit
llms.txt ist eine kuratierte Markdown-Landkarte deiner Website fuer KI-Modelle, abgelegt unter `/llms.txt`. Sie loest ein konkretes Problem — begrenzte Kontextfenster und unleserliches HTML — indem sie vorverdauten, priorisierten Inhalt an einer vorhersehbaren Stelle bereitstellt. `llms-full.txt` ergaenzt das um den vollstaendigen Volltext fuer Modelle mit grossem Kontext.
Ob die grossen Anbieter die Datei 2026 flaechendeckend nutzen, ist offen. Aber der Aufwand ist gering, das Risiko praktisch null, und sobald mehr Tools darauf setzen, bist du vorbereitet. Erstelle eine kuratierte llms.txt, halte sie aktuell, und betrachte sie als einen No-Regret-Baustein einer durchdachten KI-Sichtbarkeitsstrategie.
Der wichtigste Gedanke zum Mitnehmen: llms.txt ist kein Trick, um Rankings zu manipulieren, sondern ein Akt der Klarheit. Du erleichterst Maschinen das Lesen genau jener Inhalte, die du ohnehin korrekt repraesentiert sehen willst. In einer Welt, in der immer mehr Menschen ueber KI-Antworten statt ueber klassische Linklisten zu Informationen gelangen, ist diese Klarheit kein Beiwerk mehr, sondern ein zunehmend wichtiger Teil davon, wie deine Marke wahrgenommen wird. Wer frueh anfaengt, sauber zu kuratieren, baut sich einen kleinen, aber realen Vorsprung auf.
Das könnte dich auch interessieren
Generative Engine Optimization (GEO): Der komplette Guide
Generative Engine Optimization (GEO) macht deine Inhalte fuer ChatGPT, Perplexity, Gemini und Google AI Overviews zitierfaehig. Der komplette Guide: Definition, Abgrenzung zu SEO, Zitierstrategien, llms.txt und Messung.
ai.txt vs llms.txt vs robots.txt für AI-Crawler
ai.txt, llms.txt und robots.txt regeln, was AI-Crawler mit deiner Website tun dürfen — aber jede Datei hat einen anderen Job. Der Vergleich: Was steuert Zugriff, was steuert Verständnis, und wie richtest du alle drei korrekt ein.
Prompt Engineering: Die Grundlagen
Prompt Engineering von Grund auf: Bausteine, Techniken, Iteration und die häufigsten Fehler. Der vollständige Leitfaden für verlässliche KI-Ergebnisse 2026.
