sitemap.xml

sitemap.xml — XML-файл со списком всех значимых URL сайта, который помогает поисковикам обнаруживать и индексировать страницы. Стандарт Sitemap Protocol 0.9 опубликован Google, Microsoft и Yahoo 16 ноября 2006 года. Не влияет на ранжирование, но критичен для скорости индексации больших сайтов.

3 минуты чтения

sitemap.xml — это маршрутная карта сайта для поисковых краулеров. Без него Googlebot, YandexBot и другие боты обходят сайт, переходя по внутренним ссылкам — и могут пропустить страницы без хорошей перелинковки. С sitemap.xml краулер получает явный список «вот все страницы, которые мы хотим показать в индексе». Это базовый инструмент технического SEO, известный с 2006 года.

Как это работает

Файл sitemap.xml — это XML-документ с фиксированной структурой. Базовый пример:

<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
  <url>
    <loc>https://melanina.ru/</loc>
    <lastmod>2026-04-25</lastmod>
    <priority>1.0</priority>
  </url>
  <url>
    <loc>https://melanina.ru/glossary/llms-txt/</loc>
    <lastmod>2026-04-25</lastmod>
    <priority>0.8</priority>
  </url>
</urlset>

Каждый URL описывается тегом <url> со следующими свойствами:

ТегЧто значитОбязателен
locURL страницы (только абсолютный)Да
lastmodДата последнего изменения в формате ISO 8601Нет, но рекомендуется
changefreqЧастота изменений (always, hourly, daily, weekly, monthly, yearly, never)Нет, поисковики игнорируют
priorityПриоритет (0.0–1.0)Нет, Google официально игнорирует

Важный нюанс: с 2017–2018 годов и Google, и Яндекс публично подтвердили, что игнорируют свойства changefreq и priority при обходе. Имеет значение только loc и lastmod. Многие SEO-специалисты до сих пор кропотливо настраивают приоритеты — это устаревшая практика.

Лимиты и составные sitemaps

Один sitemap.xml не может содержать больше 50 000 URL и весить больше 50 МБ (или 10 МБ в архиве .gz). Для сайтов крупнее этого лимита используется sitemap index — XML-файл, который ссылается на несколько sitemap-файлов:

<?xml version="1.0" encoding="UTF-8"?>
<sitemapindex xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
  <sitemap>
    <loc>https://melanina.ru/sitemap-pages.xml</loc>
  </sitemap>
  <sitemap>
    <loc>https://melanina.ru/sitemap-glossary.xml</loc>
  </sitemap>
</sitemapindex>

Существуют специализированные расширения для разных типов контента: image sitemap (для изображений), video sitemap (для видео), news sitemap (для Google News), hreflang (для мультиязычных сайтов).

История стандарта

Протокол Sitemap впервые предложил Google в июне 2005 года. В апреле 2007 Google, Microsoft (тогда MSN) и Yahoo объявили о совместной поддержке протокола. Спецификация Sitemap Protocol 0.9 опубликована на sitemaps.org 16 ноября 2006 года и с тех пор не меняется. Это редкий случай в SEO — стандарт стабильный почти 20 лет.

Зачем это нужно

sitemap.xml решает три практические задачи.

1. Быстрая индексация новых страниц. Если сайт публикует контент часто (новости, блог, e-commerce с быстрым каталогом), без sitemap.xml между публикацией и индексацией может пройти несколько дней. С регулярно обновляемой картой — часы или минуты.

2. Индексация страниц без хорошей перелинковки. Большие сайты часто имеют «глубокие» страницы (4-5 кликов от главной), до которых краулер может не дойти. Sitemap.xml даёт явный путь к ним.

3. Сообщение об обновлениях. Через тег lastmod сайт говорит поисковику, что конкретная страница изменилась — краулер может обойти её приоритетнее. Это критично для часто обновляемого контента: новостей, цен, расписаний.

Как сообщить поисковикам о sitemap.xml

Три способа:

  1. Через robots.txt. Директива Sitemap: https://example.com/sitemap.xml — самый универсальный способ
  2. Через Google Search Console и Яндекс.Вебмастер. Загрузка карты вручную с подтверждением прав на сайт
  3. Через ping (устарело). Раньше можно было пингануть Google по URL, сейчас Google это удалил в 2023 году

Пример

В проекте e-commerce-клиента с 80 000 товаров новые карточки попадали в индекс Google в среднем через 5–7 дней после публикации. Это критично для сезонных товаров, где первые дни — половина продаж. Аудит показал две проблемы: sitemap.xml был статичным файлом, обновлялся раз в неделю; в нём были все товары вперемешку, без сегментации.

Перевели на динамическую генерацию sitemap.xml с обновлением каждый час и разделили на 8 sitemap-файлов через index: отдельно главная, категории, новые товары, акционные товары, статьи блога, информационные страницы, коллекции, бренды. Через 3 недели среднее время индексации новой карточки упало до 1,2 дня, для горячих категорий — до 4–8 часов. Прямой эффект на продажи: первые дни жизни сезонных товаров стали приносить на 24% больше выручки.

Частые вопросы

Влияет ли sitemap.xml на ранжирование?

Нет, sitemap.xml — не фактор ранжирования. Это инструмент обнаружения страниц для поискового краулера. Влияет только на то, насколько быстро поисковик найдёт и проиндексирует страницы. Косвенный эффект на трафик есть только за счёт более быстрой индексации новых страниц.

Какой максимальный размер sitemap.xml?

Стандартный лимит — 50 000 URL и 50 МБ в распакованном виде (или 10 МБ в формате .gz). Если сайт крупнее, используется sitemap index — XML-файл, который ссылается на несколько отдельных sitemap-файлов. Через index можно объединять до 50 000 sitemap-файлов, что даёт общий потолок 2,5 миллиарда URL.

Учитывают ли поисковики свойства changefreq и priority?

Нет. Google и Яндекс публично подтвердили в 2017–2018 годах, что игнорируют свойства changefreq и priority. Имеют значение только теги loc (URL) и lastmod (дата последнего изменения). Кропотливая настройка приоритетов — устаревшая SEO-практика без эффекта.

Как сообщить Google и Яндексу о sitemap.xml?

Три способа. Через robots.txt — добавить строку «Sitemap: https://example.com/sitemap.xml», это работает для всех поисковиков. Через Google Search Console — загрузить карту в разделе Sitemaps. Через Яндекс.Вебмастер — добавить URL карты в разделе Индексирование. Способ через ping URL устарел: Google удалил его в 2023 году.

Чем sitemap.xml отличается от robots.txt?

robots.txt управляет тем, что краулер не должен обходить (запреты доступа). sitemap.xml — обратное: список страниц, которые краулеру стоит обойти приоритетно. Два файла дополняют друг друга: robots.txt задаёт ограничения, sitemap.xml — рекомендации. Часто sitemap.xml указывается прямо в robots.txt через директиву Sitemap.

Нужен ли sitemap.xml маленькому сайту?

Не критично. Для сайта на 50–200 страниц с хорошей перелинковкой Googlebot и YandexBot обнаружат всё через обычный обход без карты. sitemap.xml становится действительно необходимым для сайтов от 1000+ страниц, для сайтов с глубокой структурой (4+ кликов от главной), для сайтов с быстрым появлением новых страниц (новости, e-commerce).

Можно ли указывать в sitemap.xml страницы с noindex?

Нет, не имеет смысла и считается ошибкой. sitemap.xml — это список страниц, которые сайт хочет видеть в индексе. Если страница помечена noindex, её не нужно включать в sitemap. Если включить — Google в Search Console будет показывать предупреждение о противоречивых сигналах. Также не нужно включать редиректы (3xx), 404 и страницы с canonical на другие URL.

Материалы по теме

Валентина Меланина

Нужна консультация?

Разберу ваш сайт и покажу точки роста

Если хотите понять, как этот термин применить к вашему проекту — начнём с аудита.