Разрешить Google индексировать ТОЛЬКО нужные мне страницы

У меня большой сайт (более 40 000 страниц), и я хочу свести к минимуму количество страниц, индексируемых Google, т. е. я хочу проиндексировать только 500 страниц.

Мне кажется, что я могу найти только вариант не индексировать страницы, и для меня не будет индексировать 39 500 страниц, это не имеет смысла.

Пример моего файла Robots.txt.

User-agent: *
Noindex:  /category/long-site-url-1/
Noindex:  /
Noindex:  /site-url-2/
Noindex:  /site-url-3/

Sitemap: https://sitedomain/sitemap.xml

person Owen O'Neill    schedule 20.09.2017    source источник


Ответы (1)


Noindex в robots.txt является/была только экспериментальной функцией (и никогда не документировалась/указывалась).

Вы должны добавить элемент meta-robots в HTML или отправить заголовок X-Robots-Tag в HTTP для каждой затронутой страницы:

<meta name="robots" content="noindex" />
X-Robots-Tag: noindex
person unor    schedule 22.09.2017