Почему на WordPress с WooCommerce появляется sitemap.xml с дублями и проблемами пагинации?

    Владельцы сайтов на WordPress, особенно интернет-магазинов на WooCommerce, нередко сталкиваются с ситуацией: в корне сайта появляется файл /sitemap.xml, который содержит множество дублирующихся ссылок и ссылок со страниц пагинации. При этом владелец утверждает, что файл генерируется из панели управления хостингом (например, reg.ru). Возникает закономерный вопрос: как внешний сервис на хостинге может получить доступ к базе данных WordPress и создать правильную карту сайта?

    Откуда берётся sitemap.xml на хостинге?

    Многие современные хостинг-провайдеры, включая reg.ru, предоставляют в панели управления встроенные инструменты для SEO-оптимизации. Один из таких инструментов - автоматическая генерация файла sitemap.xml. Этот сервис работает на уровне сервера: он сканирует файловую систему и базу данных сайта, используя стандартные API WordPress (например, wpdb), чтобы собрать все страницы, записи, товары и категории. Затем он формирует XML-карту, не всегда корректно обрабатывая пагинацию и дубли.

    Таким образом, это не внешняя программа, а встроенный функционал хостинга, который подключается к БД WordPress через те же механизмы, что и сам движок.

    Почему возникают дубли и проблемы с пагинацией?

    При генерации sitemap.xml хостинговым инструментом часто не учитываются правила, заданные плагинами SEO (например, Yoast SEO). Плагин Yoast SEO создаёт собственный файл index-sitemap.xml, который уже правильно фильтрует дубли, исключает страницы пагинации и учитывает канонические URL. Однако хостинговый сервис может игнорировать эти настройки, добавляя в карту все варианты URL, включая /page/2/, /page/3/ и т.д., а также дубли товаров с разными параметрами сортировки.

    Кроме того, с версии WordPress 5.5 ядро само генерирует wp-sitemap.xml, что может создавать путаницу, если одновременно активны несколько источников карт сайта.

    Как исправить проблему с дублями в sitemap.xml?

    Для устранения дублей и неправильной пагинации рекомендуется:

    • Отключить автоматическую генерацию sitemap.xml в панели хостинга. Обычно это можно сделать в разделе «SEO» или «Инструменты» вашего хостинг-аккаунта.
    • Использовать только один источник карты сайта. Лучше доверить эту задачу плагину Yoast SEO или встроенному функционалу WordPress (wp-sitemap.xml), отключив все остальные.
    • Настроить Yoast SEO: в разделе «SEO» → «Общие» → «Функции» убедитесь, что опция «XML-карты сайта» включена. Проверьте, что в настройках исключены страницы пагинации и дублирующиеся URL.
    • Проверить файл robots.txt: добавьте директиву Sitemap: https://вашсайт.ru/index-sitemap.xml и закройте от индексации /sitemap.xml (если он генерируется хостингом).

    Роль Woocommerce в появлении дублей

    Интернет-магазины на WooCommerce особенно подвержены проблеме дублей, так как каждый товар может иметь несколько URL (с разными параметрами фильтрации, сортировки, пагинации категорий). Хостинговый генератор sitemap.xml часто захватывает все эти варианты, что приводит к огромному количеству дублирующихся страниц в карте сайта. Правильная настройка SEO-плагина и отключение сторонних генераторов - ключ к чистой карте сайта.

    Заключение

    Файл /sitemap.xml, создаваемый панелью хостинга reg.ru, - это результат работы встроенного сервиса, который имеет доступ к базе данных WordPress через стандартные интерфейсы. Однако его работа часто конфликтует с плагинами SEO и ядром WordPress, порождая дубли и проблемы с пагинацией. Для корректной индексации сайта рекомендуется отключить эту функцию и использовать только один надёжный источник карты сайта - например, Yoast SEO или wp-sitemap.xml.

    Часто задаваемые вопросы