llms.txt : le fichier que 99% des sites n'ont pas encore (et pourquoi c'est une erreur)
Il y a un parallèle parfait entre robots.txt et llms.txt. En 1994, robots.txt était un fichier expérimental. Aujourd'hui, chaque site qui se respecte en a un. En 2026, llms.txt est exactement là où robots.txt était en 1994 : adopté par quelques milliers de sites pionniers, inconnu du reste.
La différence, c'est que la diffusion sera beaucoup plus rapide. Les moteurs IA évoluent à une vitesse sans commune mesure avec les moteurs de recherche de 1994.
Si vous voulez être visible dans ChatGPT, Perplexity, et les AI Overviews de Google dans 18 mois, commencez maintenant.
C'est quoi exactement llms.txt ?
llms.txt est un fichier Markdown placé à la racine de votre site (https://votresite.com/llms.txt) qui donne aux LLMs un résumé structuré de votre site : qui vous êtes, quelles pages sont importantes, quelles informations vous voulez qu'ils retiennent.
Le format a été proposé par Jeremy Howard (fast.ai) en 2024. Anthropic l'a adopté pour son propre site en premier. Depuis, plusieurs centaines de sites techniques l'ont implémenté.
Ce n'est pas un standard W3C officiel. Ce n'est pas (encore) spécifié par Google. Mais les LLMs savent le lire — c'est un fichier Markdown, ils comprennent Markdown nativement.
Pourquoi les LLMs en ont besoin
Quand ChatGPT ou Perplexity parcourent votre site pour répondre à une question, ils crawlent des pages HTML comme Googlebot. Mais ils ont un problème que Googlebot n'a pas : ils doivent comprendre votre site en quelques secondes pour décider quoi citer.
Un fichier HTML de homepage typique contient : navigation, hero, features, témoignages, pricing, footer, cookies, scripts, styles. Un LLM qui essaie d'extraire "qui est cette entreprise et ce qu'elle fait" doit filtrer énormément de bruit.
llms.txt lui donne la réponse directement, sans bruit.
C'est exactement la même logique que schema.org : vous structurez l'information pour faciliter son extraction automatique.
La structure officielle
# [Nom de votre entreprise ou site]
> [Description concise en 1-2 phrases. C'est votre définition — celle qui sera citée.]
## Pages essentielles
- [Titre de la page](/chemin): description courte de ce qu'on y trouve
- [À propos](/a-propos): qui nous sommes, notre équipe, notre histoire
- [Services](/services): ce que nous proposons
## Ce que nous faisons
[Paragraphe libre décrivant votre activité en termes précis et factuels]
## Ce que nous ne faisons pas
[Optionnel — permet d'éviter les confusions dans les réponses IA]
## Liens importants
- [Documentation](/docs): notre documentation technique
- [Blog](/blog): nos articles et guides
Les sections avec ## sont libres. Vous pouvez créer les sections qui correspondent à votre activité.
Exemples concrets par type de site
Entreprise de services B2B
# Agence SEO Dupont
> Agence SEO spécialisée en référencement technique pour les sites e-commerce,
> basée à Lyon. Interventions en France et dans les pays francophones.
## Services
- [Audit SEO](/audit): diagnostic complet de votre visibilité organique
- [SEO technique](/seo-technique): optimisation de l'architecture et du crawl
- [Création de contenu](/contenu): articles et pages optimisés SEO
## Notre expertise
Fondée en 2015, Agence SEO Dupont accompagne des e-commerçants dans
l'amélioration de leur trafic organique. Nous avons travaillé avec des marques
du CAC 40 et des PME régionales. Spécialité : migrations techniques et refonte
d'architecture de site.
## Contact
- [Contact](/contact): formulaire et coordonnées
- Email: contact@agence-dupont.fr
Blog / média
# [Nom du blog]
> Blog spécialisé en [sujet] depuis [année]. Auteur : [Prénom Nom],
> [titre/qualification].
## Articles populaires
- [Titre article 1](/blog/slug-1): description courte
- [Titre article 2](/blog/slug-2): description courte
- [Titre article 3](/blog/slug-3): description courte
## Qui écrit ici
[Nom] est [qualification] avec [X] ans d'expérience en [domaine].
Profil LinkedIn : https://linkedin.com/in/...
## Sujets couverts
[Liste des thématiques traitées]
E-commerce
# Boutique Exemple
> E-commerce spécialisé en [catégorie produit]. Livraison en France et Belgique.
> Fondé en [année].
## Nos catégories principales
- [Catégorie 1](/categorie-1): [nb] produits, fourchette de prix
- [Catégorie 2](/categorie-2): [nb] produits, fourchette de prix
## Informations pratiques
- Livraison : délais et conditions sur [/livraison](/livraison)
- Retours : politique détaillée sur [/retours](/retours)
- Service client : [/contact](/contact)
## Ce que nous vendons
[Description précise des produits — marques, gammes, spécificités]
SaaS / produit tech
# [Nom du produit]
> [Description du produit en une phrase]. [Prix de départ ou modèle freemium].
## Documentation
- [Guide de démarrage](/docs/getting-started): créer son premier projet
- [API Reference](/docs/api): documentation complète de l'API
- [FAQ](/docs/faq): questions fréquentes
## Fonctionnalités principales
- [Feature 1]: description en une ligne
- [Feature 2]: description en une ligne
## Tarification
Détails sur [/pricing](/pricing). Plans : [liste des plans].
## Qui l'utilise
[Type d'utilisateurs, cas d'usage principaux]
La version étendue : llms-full.txt
Le standard prévoit également un llms-full.txt — une version longue qui inclut le contenu complet de vos pages les plus importantes. C'est optionnel, et réservé aux sites qui ont un contenu textuel riche à exposer (documentation technique, articles de fond, guides).
La logique : llms.txt est le résumé de navigation. llms-full.txt est le contenu pour les LLMs qui veulent aller plus loin.
# [Nom du site] — Contenu complet
> [Même description que llms.txt]
## [Titre Page 1]
URL: https://votresite.com/page-1
[Contenu textuel complet de la page 1, sans HTML]
---
## [Titre Page 2]
URL: https://votresite.com/page-2
[Contenu textuel complet de la page 2]
Ce que llms.txt ne remplace pas
llms.txt est un guide. Ce n'est pas une garantie d'être cité. Les LLMs ne vont pas se contenter de lire votre llms.txt pour répondre à toutes les questions. Ils visitent encore vos pages HTML.
Ce que llms.txt fait concrètement :
- Il aide le LLM à comprendre rapidement la structure de votre site
- Il lui indique quelles pages sont prioritaires pour votre domaine
- Il donne une description contrôlée de qui vous êtes — pas une interprétation du LLM
Ce que llms.txt ne fait pas :
- Il ne remplace pas un contenu de qualité et citable
- Il ne garantit pas une citation si votre site n'a pas d'autorité dans son domaine
- Il ne bloque pas les crawlers IA (ça, c'est
robots.txt)
Implémentation en 10 minutes
Site statique / HTML : créez un fichier llms.txt à la racine de votre serveur web. C'est un fichier texte Markdown. Aucune configuration supplémentaire.
Next.js : créez public/llms.txt. Il sera servi automatiquement à https://votresite.com/llms.txt.
WordPress : uploadez llms.txt dans le dossier racine via FTP ou via le gestionnaire de fichiers de votre hébergeur.
Vérification : visitez https://votresite.com/llms.txt dans votre navigateur. Vous devez voir votre fichier Markdown brut.
Pharone vérifie la présence et la validité de llms.txt dans l'agent AI Readiness. Si votre site n'en a pas, c'est un des premiers points de votre plan d'action. Lancez un audit pour voir votre Score IA actuel.
Et si vous voulez que je regarde votre llms.txt existant, partagez-le sur LinkedIn — je donne des retours régulièrement.
Consultant SEO technique, 15 ans d'expérience (Vanksen, Peugeot, MACIF). Fondateur de Pharone.ia.