meta robots noindex

meta robots noindex — HTML-директива, запрещающая поисковикам индексировать страницу. Размещается в теге <meta> в head или передаётся через HTTP-заголовок X-Robots-Tag. Главное отличие от Disallow в robots.txt: noindex запрещает индексацию (попадание в выдачу), а не обход страницы краулером.

2 минуты чтения

meta robots noindex — самый точный способ убрать страницу из выдачи поисковиков. Это два разных варианта одной директивы: HTML-тег в head страницы или HTTP-заголовок X-Robots-Tag, который сервер отдаёт вместе с ответом. Оба эквивалентны: первый удобнее для статического контента, второй — для PDF, изображений и других не-HTML файлов.

Как это работает

HTML-вариант размещается в head:

<meta name="robots" content="noindex">

HTTP-заголовок (для PDF и не-HTML файлов):

X-Robots-Tag: noindex

Когда краулер находит такую страницу, он её обходит, парсит, но в индекс не добавляет. Если страница уже была в индексе, она оттуда удаляется — это занимает от нескольких часов до нескольких недель в зависимости от частоты обхода.

Директивы meta robots

noindex — одна из набора директив:

ДирективаЧто делает
noindexНе индексировать страницу
indexИндексировать (значение по умолчанию, обычно не пишется)
nofollowНе передавать вес по ссылкам с этой страницы
followПередавать вес по ссылкам (по умолчанию)
noneЭквивалент noindex, nofollow
noarchiveНе сохранять кэш страницы
nosnippetНе показывать описание в выдаче
max-snippetОграничить длину описания

Можно комбинировать через запятую: <meta name="robots" content="noindex, nofollow">.

noindex vs Disallow в robots.txt — главная разница

Это самая частая путаница в техническом SEO. Директивы решают разные задачи:

Параметрnoindex (meta или X-Robots-Tag)Disallow (robots.txt)
Что запрещаетИндексацию (попадание в выдачу)Обход краулером
Краулер обходит страницу?Да, обходит, читает, не индексируетНет, не обходит
Страница может попасть в индекс?Не можетМожет — если на неё ведут внешние ссылки
Где задаётсяНа самой страницеВ корне сайта
Когда применятьЧтобы убрать страницу из выдачиЧтобы сэкономить crawl budget

Парадокс Disallow: если в robots.txt запретить обход страницы, но на неё ведут внешние ссылки, Google может всё равно показать её в выдаче — с пометкой «нет описания». Поэтому для гарантированного удаления из индекса используется noindex, а не Disallow.

Важное правило: если нужно убрать страницу из индекса через noindex, её не должно быть в robots.txt. Иначе краулер не зайдёт на страницу и не увидит директиву noindex — страница останется в индексе.

Зачем это нужно

noindex применяется в шести типичных сценариях.

  1. Служебные страницы. Корзина, страница оплаты, личный кабинет — не должны быть в выдаче
  2. Страницы фильтров и сортировки. Каталог с GET-параметрами вроде ?sort=price создаёт тысячи дублей — для них noindex или canonical
  3. Дубликаты контента. Печатные версии страниц, мобильные дубли
  4. Тонкий контент. Карточки товаров без описаний, страницы с одной строкой, неинформативные разделы
  5. Внутренний поиск сайта. Страницы результатов поиска часто бесконечные и низкокачественные
  6. Архивы устаревшего контента. Старые акции, анонсы прошлых мероприятий

Пример

В проекте e-commerce-клиента в Search Console было около 200 000 страниц-дублей с GET-параметрами фильтров: /category/?color=red, /category/?size=L&color=red и так далее. Все они были в индексе, разбавляя релевантность основных карточек.

Решение: добавили в шаблон страниц с GET-параметрами тег <meta name="robots" content="noindex, follow">. Параметр follow важен: краулер всё ещё переходит по ссылкам с такой страницы дальше, но саму страницу не индексирует. Параллельно убрали эти URL из sitemap.xml. Через 6 недель из индекса ушло 187 000 страниц-дублей. Видимость основных категорий выросла на 12% за следующие 2 месяца — Google переключил внимание на качественные страницы.

Альтернативой могло быть использование canonical, но canonical — рекомендация, которую Google может проигнорировать. noindex — жёсткая директива.

Частые вопросы

В чём разница между noindex и Disallow в robots.txt?

noindex запрещает индексацию страницы (попадание в выдачу), но краулер всё равно её обходит. Disallow запрещает обход краулером — но если на страницу ведут внешние ссылки, она может попасть в индекс с пометкой «нет описания». Для гарантированного удаления из выдачи используется noindex, для экономии crawl budget — Disallow.

Можно ли использовать одновременно noindex и Disallow?

Нет, это противоречивая комбинация. Если в robots.txt стоит Disallow, краулер не зайдёт на страницу и не увидит директиву noindex. Страница может остаться в индексе через внешние ссылки. Если нужно убрать страницу из индекса, открой её в robots.txt и добавь noindex на саму страницу. После того как страница ушла из индекса, можно закрыть её Disallow для экономии crawl budget.

Как быстро noindex удаляет страницу из индекса?

От нескольких часов до нескольких недель. Скорость зависит от частоты обхода страницы краулером и общей частоты обновления индекса. Для часто обходимых страниц (главная, важные разделы) удаление может занять сутки. Для редко обходимых — до 4–6 недель. Ускорить можно через инструмент удаления URL в Google Search Console и Яндекс.Вебмастер.

Чем отличается meta noindex от X-Robots-Tag?

Эффект одинаковый, разница в способе передачи. meta noindex — это HTML-тег в head страницы, работает только для HTML-страниц. X-Robots-Tag — HTTP-заголовок в ответе сервера, работает для любого типа файлов: HTML, PDF, изображения, видео. X-Robots-Tag — единственный способ закрыть от индексации не-HTML файлы.

Когда использовать noindex с follow, а когда без?

noindex, follow — когда нужно убрать страницу из индекса, но сохранить передачу ссылочного веса дальше по сайту. Типичный кейс: страницы фильтров каталога с GET-параметрами. Сами страницы не индексируются, но ссылки с них на товары работают. noindex, nofollow (или эквивалентное none) — когда страница не должна влиять на сайт вообще: тестовые страницы, страницы благодарности после форм.

Какой синтаксис для noindex только для Google или только для Яндекса?

Через атрибут name можно указывать конкретного бота. Для Google: meta name="googlebot" content="noindex". Для Яндекса: meta name="yandex" content="noindex". Для всех ботов сразу: meta name="robots" content="noindex". На практике в 99% случаев используется универсальное robots — разные правила для Google и Яндекса нужны редко.

Влияет ли noindex на ранжирование других страниц сайта?

Косвенно — да. Удаление низкокачественных страниц через noindex улучшает общее качество индексируемого контента и помогает поисковикам сосредоточиться на ценных страницах. Это особенно заметно на больших сайтах с большим количеством дублей и тонкого контента. Прямого фактора ранжирования нет, но улучшение видимости основных страниц после массовой деиндексации низкокачественных — типичный результат.

Материалы по теме

Валентина Меланина

Нужна консультация?

Разберу ваш сайт и покажу точки роста

Если хотите понять, как этот термин применить к вашему проекту — начнём с аудита.