База знаний   /   Branched Sitemap

Статус "Не получено" в Google Search Console для Branched Sitemap

Опубликовано 20 August 2021 11:50 pm

В поддержку обратился пользователь, у которого проиндексировалась подкарта https://smakso.kz/index.php?route=extension/feed/branched_sitemap/main

Но не проиндексировалась https://smakso.kz/index.php?route=extension/feed/branched_sitemap/categories&page=1

и тд

Статус

При этом валидатор карты от Яндекса говорит, что с Branched Sitemap для OpenCart все ок

Анализ ответа сервера через bertal.ru показал, что все ок. То есть, статус 200 и Content-Type: text/xml; charset=UTF-8

Валидатор карты сайта от Яндекса показал, что вроде как с картой все ок.

Погуглил. Нашел тему Sitemap в статусе "Не получено" в поддержке Google. Там речь шла о запрете индексации карты. Посмотрел robots.txt . Подозрительными показались следующие строки:

Disallow: /*?page=
Disallow: /*&page=    

Вообще, у каждого SEOшника своя метода. Кто вешает каноникал, кто добавлять к мета-тегам слова " - Страница Х", а кто запрещает индексировать страницы 2 и более. Но, похоже, что конкретно это правило мешает боту Google индексировать карту. Для выхода из ситуации пользователю предложено дополнить инструкции в robots.txt следующими строками:

Disallow: /*?page=
Disallow: /*&page=
Allow: /*branched_sitemap*?page= Allow: /*branched_sitemap*&page=

Спустя 2 дня после изменения правил в robots.txt, пользователь прислал сообщение, что статус карты стал "Успешно" на всех подкартах.

*Примечание
Несмотря на то, что на снимке экрана из Google Search Console каждая подкарта имеет свой отдельный статус, отправлять в консоль и (или) добавлять в robots.txt необходимо всего 1 карту, которая является sitemapindex. То есть, содержит перечень всех дочерник подкарт.