Un guide pour les IA, pas un gardien
Proposé en septembre 2024 par Jeremy Howard (Answer.AI), le fichier llms.txt est un document Markdown placé à la racine d'un site web. Contrairement à robots.txt qui contrôle l'accès des crawlers, llms.txt joue le rôle de guide touristique : il oriente les LLM vers les pages les plus pertinentes du site — documentation, FAQ, guides, fiches produit.
Comment ça fonctionne
Le format est simple : des titres H2 pour organiser les sections, des bullet points avec liens et descriptions courtes. Le fichier pointe vers les contenus à forte valeur ajoutée, idéalement en version Markdown pour faciliter le parsing par les IA.
## Documentation
- /docs/api.md – Référence API complète
- /docs/quickstart.md – Guide de démarrage
## FAQ
- /help/faq.md – Questions fréquentes
L'objectif : réduire les hallucinations en fournissant une carte structurée du contenu plutôt que de laisser les IA crawler aveuglément.
Adoption : 10 % des sites, mais des réserves
Selon une analyse SE Ranking portant sur 300 000 domaines, l'adoption de llms.txt atteint 10,13 % — principalement sur des sites de taille moyenne. Les grands éditeurs restent prudents. John Mueller (Google) a déclaré : « Aucun service IA n'a confirmé utiliser llms.txt. » Google lui-même avait ajouté le fichier à ses sites développeurs en décembre 2024… avant de le retirer en 24 heures.
Côté IA, seul Anthropic (Claude) mentionne explicitement llms.txt dans sa documentation officielle. Sur 9 sites testés par Search Engine Land, 8 n'ont constaté aucun changement de trafic mesurable.
llms.txt, ai.txt, robots.txt : trois fichiers complémentaires
Le paysage se complexifie avec l'émergence de ai.txt (2025), qui permet des permissions granulaires par type d'action (résumé autorisé, entraînement interdit). Chaque fichier a son rôle : robots.txt contrôle l'accès, llms.txt guide la compréhension, ai.txt définit les usages autorisés.
Pour l'instant, llms.txt reste un pari à faible risque : l'implémentation prend quelques minutes, ne pénalise pas le SEO, et positionne le site si le standard se généralise.