llms.txt

llms.txt — Markdown-файл в корне сайта со структурированным списком ключевых страниц для языковых моделей. Стандарт предложил Джереми Ховард (Answer.AI) в сентябре 2024.

4 минуты чтения
llms.txt

По смыслу llms.txt похож на robots.txt и sitemap.xml, но решает другую задачу: не управляет поведением краулеров, а даёт LLM чистый структурированный вход для извлечения контекста. Файл размещается по адресу example.com/llms.txt и содержит курируемый список самых ценных страниц сайта со ссылками на их машиночитаемые Markdown-версии.

Как это работает

Современные языковые модели сталкиваются с двумя ограничениями при работе с контентом сайтов. Первое — размер контекстного окна: даже у топовых моделей он недостаточен, чтобы вместить большой сайт целиком. Второе — преобразование HTML в чистый текст. Реальная страница содержит навигацию, баннеры, футер, виджеты и маркетинговые блоки. Полезная информация теряется в этом шуме, а LLM получает зашумлённый контекст и хуже отвечает на вопросы пользователя.

llms.txt предлагает простое решение: владелец сайта вручную составляет список 10–50 самых ценных страниц с короткими описаниями и ссылками на Markdown-версии. Спецификация задаёт строгую структуру:

  • H1 — название сайта или проекта
  • Blockquote — краткое описание (1–3 предложения), кто и для кого этот сайт
  • Опциональные параграфы — дополнительный контекст
  • H2-секции со списками ссылок в формате [Заголовок](URL): краткое описание
  • Секция Optional — менее важные ресурсы, которые модель может пропустить

Пример минимального валидного файла:

# Melanina.ru

> Контент-хаб Валентины Меланиной о маркетинге, веб-разработке и аналитике для бизнеса.

## Гайды

- [Оптимизация под AI-поиск](/guides/ai-search-optimization/index.md): пошаговый разбор GEO для русскоязычных сайтов
- [Core Web Vitals в 2026](/guides/core-web-vitals/index.md): метрики, инструменты, типичные ошибки

## Глоссарий

- [llms.txt](/glossary/llms-txt/index.md): спецификация и применение

## Optional

- [О Валентине](/about/index.md): биография, экспертиза, проекты

Парность важна: каждая HTML-страница должна иметь Markdown-двойник по адресу с расширением .md. Например, статья /glossary/llms-txt/ должна быть доступна и как /glossary/llms-txt/index.html.md.

llms.txt и llms-full.txt — в чём разница

Спецификация определяет два связанных файла:

Параметрllms.txtllms-full.txt
НазначениеИндекс — список ссылок на ключевые страницыПолный дамп — весь контент в одном Markdown-файле
РазмерОбычно 10–100 КБОт сотен КБ до десятков МБ
Когда использоватьХочешь, чтобы LLM сама выбрала, какие страницы загружатьХочешь дать модели всё за один запрос
Кто публикуетБольшинство сайтовСайты с компактной документацией: Anthropic, Perplexity

Anthropic, например, публикует llms-full.txt — полный дамп документации Claude в одном файле. Так LLM может загрузить всю справочную информацию за одно обращение.

Зачем это нужно

Несмотря на спорный статус, у llms.txt есть три практических кейса, где польза измерима.

1. AI-ассистенты для разработчиков. Cursor, Windsurf, Codeium и другие IDE-плагины активно ингестят документацию через llms.txt. Если твой продукт — SaaS или API, и разработчики пишут под него код, llms.txt напрямую улучшает качество AI-подсказок. Vercel, по данным Mintlify, получает около 10% новых регистраций через ChatGPT.

2. Снижение затрат на токены в RAG-пайплайнах. Если ты строишь собственного AI-ассистента поверх документации, llms-full.txt сокращает время на парсинг и количество токенов в контексте.

3. Хеджирование на будущее. Поддержки от крупных вендоров пока нет, но если она появится — те, у кого файл уже есть, окажутся в выгодном положении сразу. Стоимость внедрения для большинства сайтов измеряется часами работы разработчика.

Кто использует, кто игнорирует

На апрель 2026 ландшафт выглядит асимметрично.

Кто публикует свои llms.txt: Anthropic, OpenAI, Perplexity, Cloudflare, Stripe, Vercel, Mintlify, Cursor, Astro, Supabase, Zapier. Google добавил llms.txt в собственную документацию для разработчиков в декабре 2025.

Кто читает чужие llms.txt при формировании ответов: ни один крупный вендор официально не подтвердил. Джон Мюллер и Гэри Иллис из Google публично заявляли в 2025 году, что Google не использует llms.txt как операционный сигнал. Серверные логи нескольких независимых исследований показывают минимальный или нулевой трафик к llms.txt от GPTBot, ClaudeBot, Google-Extended и PerplexityBot.

По данным SE Ranking на конец 2025 года, проникновение llms.txt среди 300 000 проанализированных доменов составляет около 10%. BuiltWith на октябрь 2025 насчитал более 844 000 сайтов с этим файлом.

Пример

В декабре 2025 года я внедрила llms.txt и llms-full.txt на сайте клиента — B2B SaaS-сервиса с публичной документацией API. Файл собрался автоматически из существующего Markdown-источника документации за один день работы разработчика. Через три месяца в логах Cloudflare появились запросы от ChatGPT-User и OAI-SearchBot к llms.txt — около 40 обращений в неделю. Прямого роста трафика из ChatGPT не зафиксировано, но цитирование API-методов в ответах ChatGPT стало точнее: ушли устаревшие сигнатуры функций, которые модель путала из-за необновлённых данных в обучающей выборке.

Вывод: llms.txt не даёт измеримого SEO-эффекта, но повышает корректность цитирования у пользователей AI-ассистентов. Для технических продуктов это уже достаточная причина, чтобы внедрить.

Частые вопросы

Чем llms.txt отличается от robots.txt и sitemap.xml?

robots.txt управляет поведением поисковых краулеров (что можно индексировать). sitemap.xml — машиночитаемый список всех URL для поисковика. llms.txt — курируемая короткая карта самого ценного контента специально для LLM, со ссылками на Markdown-версии страниц. Это три разных стандарта для трёх разных задач.

Поддерживают ли llms.txt ChatGPT, Claude, Perplexity и Google?

На апрель 2026 ни один из них официально не подтвердил, что читает llms.txt с внешних сайтов при формировании ответов. Все они публикуют llms.txt для своей собственной документации, но это про публикацию, а не про чтение. Джон Мюллер из Google публично заявлял, что Google не использует llms.txt.

Стоит ли внедрять llms.txt в 2026, если поддержки от LLM нет?

Да, если стоимость внедрения низкая (для сайтов на Markdown — несколько часов разработки). Это страховка на случай адопции и реальный плюс для AI-ассистентов разработчиков, которые уже сейчас активно его читают. Нет, если внедрение требует значительных усилий и у тебя нет технической документации, которую цитируют LLM.

Как создать llms.txt для сайта на 1С-Битрикс или WordPress?

Самый простой путь — генерировать файл скриптом из инфоблока или БД при публикации контента. Нужно: 1) выбрать 10–50 самых важных страниц, 2) для каждой собрать Markdown-версию по тому же URL с расширением .md, 3) сложить корневой llms.txt с H1 → blockquote → H2-секциями со ссылками. Для WordPress есть готовые плагины, для Битрикса проще написать кастомный обработчик в шаблоне.

Чем llms.txt отличается от llms-full.txt?

llms.txt — короткий индексный файл со ссылками на Markdown-версии страниц (LLM сама решает, что загружать). llms-full.txt — полный дамп всей документации в одном файле, чтобы модель получила контекст за один запрос. Для большинства сайтов достаточно только llms.txt. llms-full.txt оправдан для документации API и технических продуктов.

Дают ли llms.txt прирост поискового трафика?

Прямого подтверждённого прироста SEO-трафика от внедрения llms.txt нет. Файл не влияет на ранжирование в Google и Яндексе. Косвенный эффект возможен через более точное цитирование сайта в AI-ассистентах, что приводит часть пользователей на сайт по бренд-запросам.

Где взять список сайтов с llms.txt для примера?

Три актуальных каталога: directory.llmstxt.cloud (по индустриям), llmstxt.site (с подсчётом токенов), llmstxthub.com. Для эталонного образца смотри файлы Anthropic (docs.claude.com/llms.txt), Cloudflare (developers.cloudflare.com/llms.txt) и Stripe (stripe.com/docs/llms.txt).

Материалы по теме

Валентина Меланина

Нужна консультация?

Разберу ваш сайт и покажу точки роста

Если хотите понять, как этот термин применить к вашему проекту — начнём с аудита.