sitemap.xml — это маршрутная карта сайта для поисковых краулеров. Без него Googlebot, YandexBot и другие боты обходят сайт, переходя по внутренним ссылкам — и могут пропустить страницы без хорошей перелинковки. С sitemap.xml краулер получает явный список «вот все страницы, которые мы хотим показать в индексе». Это базовый инструмент технического SEO, известный с 2006 года.
Как это работает
Файл sitemap.xml — это XML-документ с фиксированной структурой. Базовый пример:
<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<url>
<loc>https://melanina.ru/</loc>
<lastmod>2026-04-25</lastmod>
<priority>1.0</priority>
</url>
<url>
<loc>https://melanina.ru/glossary/llms-txt/</loc>
<lastmod>2026-04-25</lastmod>
<priority>0.8</priority>
</url>
</urlset>
Каждый URL описывается тегом <url> со следующими свойствами:
| Тег | Что значит | Обязателен |
|---|---|---|
| loc | URL страницы (только абсолютный) | Да |
| lastmod | Дата последнего изменения в формате ISO 8601 | Нет, но рекомендуется |
| changefreq | Частота изменений (always, hourly, daily, weekly, monthly, yearly, never) | Нет, поисковики игнорируют |
| priority | Приоритет (0.0–1.0) | Нет, Google официально игнорирует |
Важный нюанс: с 2017–2018 годов и Google, и Яндекс публично подтвердили, что игнорируют свойства changefreq и priority при обходе. Имеет значение только loc и lastmod. Многие SEO-специалисты до сих пор кропотливо настраивают приоритеты — это устаревшая практика.
Лимиты и составные sitemaps
Один sitemap.xml не может содержать больше 50 000 URL и весить больше 50 МБ (или 10 МБ в архиве .gz). Для сайтов крупнее этого лимита используется sitemap index — XML-файл, который ссылается на несколько sitemap-файлов:
<?xml version="1.0" encoding="UTF-8"?>
<sitemapindex xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<sitemap>
<loc>https://melanina.ru/sitemap-pages.xml</loc>
</sitemap>
<sitemap>
<loc>https://melanina.ru/sitemap-glossary.xml</loc>
</sitemap>
</sitemapindex>
Существуют специализированные расширения для разных типов контента: image sitemap (для изображений), video sitemap (для видео), news sitemap (для Google News), hreflang (для мультиязычных сайтов).
История стандарта
Протокол Sitemap впервые предложил Google в июне 2005 года. В апреле 2007 Google, Microsoft (тогда MSN) и Yahoo объявили о совместной поддержке протокола. Спецификация Sitemap Protocol 0.9 опубликована на sitemaps.org 16 ноября 2006 года и с тех пор не меняется. Это редкий случай в SEO — стандарт стабильный почти 20 лет.
Зачем это нужно
sitemap.xml решает три практические задачи.
1. Быстрая индексация новых страниц. Если сайт публикует контент часто (новости, блог, e-commerce с быстрым каталогом), без sitemap.xml между публикацией и индексацией может пройти несколько дней. С регулярно обновляемой картой — часы или минуты.
2. Индексация страниц без хорошей перелинковки. Большие сайты часто имеют «глубокие» страницы (4-5 кликов от главной), до которых краулер может не дойти. Sitemap.xml даёт явный путь к ним.
3. Сообщение об обновлениях. Через тег lastmod сайт говорит поисковику, что конкретная страница изменилась — краулер может обойти её приоритетнее. Это критично для часто обновляемого контента: новостей, цен, расписаний.
Как сообщить поисковикам о sitemap.xml
Три способа:
- Через robots.txt. Директива
Sitemap: https://example.com/sitemap.xml— самый универсальный способ - Через Google Search Console и Яндекс.Вебмастер. Загрузка карты вручную с подтверждением прав на сайт
- Через ping (устарело). Раньше можно было пингануть Google по URL, сейчас Google это удалил в 2023 году
Пример
В проекте e-commerce-клиента с 80 000 товаров новые карточки попадали в индекс Google в среднем через 5–7 дней после публикации. Это критично для сезонных товаров, где первые дни — половина продаж. Аудит показал две проблемы: sitemap.xml был статичным файлом, обновлялся раз в неделю; в нём были все товары вперемешку, без сегментации.
Перевели на динамическую генерацию sitemap.xml с обновлением каждый час и разделили на 8 sitemap-файлов через index: отдельно главная, категории, новые товары, акционные товары, статьи блога, информационные страницы, коллекции, бренды. Через 3 недели среднее время индексации новой карточки упало до 1,2 дня, для горячих категорий — до 4–8 часов. Прямой эффект на продажи: первые дни жизни сезонных товаров стали приносить на 24% больше выручки.