По смыслу llms.txt похож на robots.txt и sitemap.xml, но решает другую задачу: не управляет поведением краулеров, а даёт LLM чистый структурированный вход для извлечения контекста. Файл размещается по адресу example.com/llms.txt и содержит курируемый список самых ценных страниц сайта со ссылками на их машиночитаемые Markdown-версии.
Как это работает
Современные языковые модели сталкиваются с двумя ограничениями при работе с контентом сайтов. Первое — размер контекстного окна: даже у топовых моделей он недостаточен, чтобы вместить большой сайт целиком. Второе — преобразование HTML в чистый текст. Реальная страница содержит навигацию, баннеры, футер, виджеты и маркетинговые блоки. Полезная информация теряется в этом шуме, а LLM получает зашумлённый контекст и хуже отвечает на вопросы пользователя.
llms.txt предлагает простое решение: владелец сайта вручную составляет список 10–50 самых ценных страниц с короткими описаниями и ссылками на Markdown-версии. Спецификация задаёт строгую структуру:
- H1 — название сайта или проекта
- Blockquote — краткое описание (1–3 предложения), кто и для кого этот сайт
- Опциональные параграфы — дополнительный контекст
- H2-секции со списками ссылок в формате
[Заголовок](URL): краткое описание - Секция Optional — менее важные ресурсы, которые модель может пропустить
Пример минимального валидного файла:
# Melanina.ru
> Контент-хаб Валентины Меланиной о маркетинге, веб-разработке и аналитике для бизнеса.
## Гайды
- [Оптимизация под AI-поиск](/guides/ai-search-optimization/index.md): пошаговый разбор GEO для русскоязычных сайтов
- [Core Web Vitals в 2026](/guides/core-web-vitals/index.md): метрики, инструменты, типичные ошибки
## Глоссарий
- [llms.txt](/glossary/llms-txt/index.md): спецификация и применение
## Optional
- [О Валентине](/about/index.md): биография, экспертиза, проекты
Парность важна: каждая HTML-страница должна иметь Markdown-двойник по адресу с расширением .md. Например, статья /glossary/llms-txt/ должна быть доступна и как /glossary/llms-txt/index.html.md.
llms.txt и llms-full.txt — в чём разница
Спецификация определяет два связанных файла:
| Параметр | llms.txt | llms-full.txt |
|---|---|---|
| Назначение | Индекс — список ссылок на ключевые страницы | Полный дамп — весь контент в одном Markdown-файле |
| Размер | Обычно 10–100 КБ | От сотен КБ до десятков МБ |
| Когда использовать | Хочешь, чтобы LLM сама выбрала, какие страницы загружать | Хочешь дать модели всё за один запрос |
| Кто публикует | Большинство сайтов | Сайты с компактной документацией: Anthropic, Perplexity |
Anthropic, например, публикует llms-full.txt — полный дамп документации Claude в одном файле. Так LLM может загрузить всю справочную информацию за одно обращение.
Зачем это нужно
Несмотря на спорный статус, у llms.txt есть три практических кейса, где польза измерима.
1. AI-ассистенты для разработчиков. Cursor, Windsurf, Codeium и другие IDE-плагины активно ингестят документацию через llms.txt. Если твой продукт — SaaS или API, и разработчики пишут под него код, llms.txt напрямую улучшает качество AI-подсказок. Vercel, по данным Mintlify, получает около 10% новых регистраций через ChatGPT.
2. Снижение затрат на токены в RAG-пайплайнах. Если ты строишь собственного AI-ассистента поверх документации, llms-full.txt сокращает время на парсинг и количество токенов в контексте.
3. Хеджирование на будущее. Поддержки от крупных вендоров пока нет, но если она появится — те, у кого файл уже есть, окажутся в выгодном положении сразу. Стоимость внедрения для большинства сайтов измеряется часами работы разработчика.
Кто использует, кто игнорирует
На апрель 2026 ландшафт выглядит асимметрично.
Кто публикует свои llms.txt: Anthropic, OpenAI, Perplexity, Cloudflare, Stripe, Vercel, Mintlify, Cursor, Astro, Supabase, Zapier. Google добавил llms.txt в собственную документацию для разработчиков в декабре 2025.
Кто читает чужие llms.txt при формировании ответов: ни один крупный вендор официально не подтвердил. Джон Мюллер и Гэри Иллис из Google публично заявляли в 2025 году, что Google не использует llms.txt как операционный сигнал. Серверные логи нескольких независимых исследований показывают минимальный или нулевой трафик к llms.txt от GPTBot, ClaudeBot, Google-Extended и PerplexityBot.
По данным SE Ranking на конец 2025 года, проникновение llms.txt среди 300 000 проанализированных доменов составляет около 10%. BuiltWith на октябрь 2025 насчитал более 844 000 сайтов с этим файлом.
Пример
В декабре 2025 года я внедрила llms.txt и llms-full.txt на сайте клиента — B2B SaaS-сервиса с публичной документацией API. Файл собрался автоматически из существующего Markdown-источника документации за один день работы разработчика. Через три месяца в логах Cloudflare появились запросы от ChatGPT-User и OAI-SearchBot к llms.txt — около 40 обращений в неделю. Прямого роста трафика из ChatGPT не зафиксировано, но цитирование API-методов в ответах ChatGPT стало точнее: ушли устаревшие сигнатуры функций, которые модель путала из-за необновлённых данных в обучающей выборке.
Вывод: llms.txt не даёт измеримого SEO-эффекта, но повышает корректность цитирования у пользователей AI-ассистентов. Для технических продуктов это уже достаточная причина, чтобы внедрить.