Как удалить тысячи заражённых страниц из поиска Google после малвари

    После заражения плагином на пустом домене вредоносные страницы могли проиндексироваться в Google в количестве 20 000, 191 000 и более. Даже после полной очистки кода, настройки 404/410 кодов и блокировки через Cloudflare, поисковая система продолжает показывать эти URL. Разберём пошаговый план, как ускорить процесс удаления и восстановить репутацию сайта.

    Почему Google не удаляет страницы после 410 кода?

    Поисковые роботы не мгновенно обрабатывают изменения. Даже если вы настроили HTTP-статус 410 Gone (или 404), Google может повторно проверять эти URL неделями. При большом количестве страниц (десятки тысяч) процесс затягивается, так как робот постепенно обходит все ссылки.

    Основные шаги для удаления тысяч индексированных страниц

    1. Проверьте корректность 410 ответа

    Убедитесь, что сервер действительно возвращает код 410 (а не 200 с текстом «страница не найдена»). Используйте инструменты вроде httpstatus.io или Redirect Path (расширение Chrome). Если через Cloudflare включена блокировка, код может быть 403 или 520 - это не равно 410. Настройте origin-сервер так, чтобы все заражённые URL возвращали именно 410.

    2. Используйте Google Search Console (GSC)

    Для ускорения удаления можно запросить исключение страниц через Инструмент удаления URL в GSC. Но он работает только для единичных адресов. Для массового удаления (до 10 000 URL) попробуйте:

    • Создать файл с перечнем всех заражённых URL (например, через экспорт из Google Analytics или логов сервера).
    • Использовать API Google Indexing или отправлять запросы через GSC Sitemaps, указав в sitemap.xml только те страницы, которые должны быть проиндексированы. А заражённые - не включать.

    Важно: Google не гарантирует моментальное удаление, но правильные сигналы ускоряют процесс.

    3. Настройте корректные заголовки и мета-теги

    Убедитесь, что на всех заражённых страницах нет мета-тега robots: noindex - он не работает, если страница уже проиндексирована. Лучше использовать HTTP-заголовок X-Robots-Tag: noindex, nofollow в ответе сервера. Это даст Google понять, что страницу не нужно показывать в выдаче.

    4. Используйте файл robots.txt

    Добавьте в robots.txt директиву Disallow для всех заражённых путей. Например:

    User-agent: *
    Disallow: /wp-content/plugins/vulnerable-plugin/

    Это не удалит уже проиндексированные страницы, но остановит дальнейшее сканирование новых URL.

    Как ускорить обработку Google?

    Помимо технических настроек, можно использовать запрос на переобход через GSC для нескольких ключевых страниц. Для массового удаления лучше всего:

    • Дождаться естественного цикла переобхода (обычно 2-4 недели).
    • Уменьшить количество страниц на сайте (удалить все заражённые файлы и папки физически).
    • Проверить, не остались ли ссылки на заражённые страницы с других доменов (например, через backlink-анализ). Если есть - попросить удалить или добавить атрибут rel=“nofollow”.

    Профилактика повторного заражения

    Чтобы не столкнуться с такой же проблемой в будущем:

    • Тестируйте плагины на изолированном стенде (staging), а не на пустом домене, который может быть атакован.
    • Используйте надёжные антивирусные сканеры (Sucuri, Wordfence) для регулярной проверки.
    • Настройте автоматическое резервное копирование.

    Если вы уже всё сделали - 410, Cloudflare, robots.txt - остаётся только ждать. Но с помощью описанных методов вы можете сократить время ожидания с нескольких месяцев до 2-3 недель.

    Часто задаваемые вопросы