О «дополнительных результатах» в поисковой выдаче Google

Многим веб-мастерам, чьи страницы помещаются на странице результатов поиска Google среди Supplementary Results (или Дополнительных Результатов), хотелось бы знать, чем обусловлена такая категоризация результатов поиска. Среди наиболее частых вопросов веб-мастеров звучат такие:

 

  1. Почему та или иная страница сайта помечается как «дополнительная» во время индексирования сайта поисковым роботом?
  2. Как ранжируется «дополнительная» страница при обработке поискового запроса по ключевым словам поисковой системой?
  3. Возвращается ли робот-индексатор на «дополнительную» страницу за возможными обновлениями ее содержимого?
  4. Влияют ли обновления на «дополнительной» странице на возможную перемену ее статуса?
  5. Правда ли, что страница, некогда посещенная индексирующим роботом Google и появляющаяся на странице выдачи результатов поиска, после удаления веб-мастером с сервера остается в выдаче Google даже год спустя?

 

Однозначный ответ могут дать только специалисты компании Google, но они по понятным причинам этого никогда не сделают. Поэтому некоторые веб-мастера решили поделиться друг с другом своими наблюдениями за работой поисковой системы Google и обобщить их в нескольких тезисах.

Компания Google заявляет, что определенные страницы помещаются среди «Дополнительных результатов поиска» для удобства пользователя и для более подробного ответа на запрос, введенный в поисковую форму, и отсюда можно сделать некоторые выводы.

Например, такой, что среди дополнительных результатов система показывает кэшированные страницы, некогда содержавшие ключевые слова поискового запроса, но уже удаленные с сервера (сервер отвечает кодом 404). Если поисковому запросу отвечает старая версия страницы, занесенная в кэш поисковой системы, то эта страница будет показана среди дополнительных результатов. Если же после обновления страницы она продолжает содержать ключевые слова поискового запроса, то показана она будет среди основных результатов.

Еще одна причина, по которой страница может быть отнесена к дополнительным результатам поиска – это то, что ее содержимое не уникально. По одной из версий, робот Google, кэшировав однажды такую «дублированную» страницу (проще говоря, страницу с копированным из других ресурсов содержимым), при обновлении индексной базы больше кэтой странице не возвращается, и в результатах поиска система всегда показывает заголовок страницы с неуникальным содержимым, некогда занесенным роботом в кэш. Неуникальной страницей робот Google может счесть не только ту страницу, содержимое которой откуда-то незаконно скопировано, но и документ, у которого есть несколько URL адресов. Учтите, что индексирующий бот Google воспринимает сайты с адресом вида «www.site.com» и «site.com» как разные. Поэтому обязательно установите 301 переадресацию с URL «site.com» на URL «www.site.com», чтобы робот поисковой системы не помещал один из этих сайтов в «дополнительные результаты».

Старайтесь так же давать каждой странице уникальные title и meta-описание, чтобы максимально исключить возможность ранжирования ее как второстепенной.

И все же, если на странице, которую индексирующий механизм Google счел вспомогательной, встречаются редкие ключевые слова или словосочетания, и такие сочетания будут запрошены пользователем – страница появится среди основных, а не дополнительных результатов поиска.

Дополнительные страницы посещаются роботами-индексаторами, но реже, чем страницы, не помеченные как вспомогательные.

Чаще всего, если веб-мастеру удается выяснить и устранить причину, по которой страница помечается как дополнительная, при обновлении кэша индексной базы она перемещается в раздел «основных» страниц. Старые версии страницы или альтернативные внутренние ссылки, ведущие на некогда вспомогательную страницу, еще долго могут храниться в кэше поисковой системы и появляться как результаты запроса [site:]; однако если страница присутствует в выдаче системы как обычный, а не вспомогательный результат запроса, не стоит беспокоиться, что у нее сохранилась «дополнительная» версия.

Если у страницы сменилось и содержание, и адрес, если в ответ на запрос страницы сервер выдает коды 302 или 404, ее старая версия может храниться в кэше индексной базы поисковой системы Google больше года. При помощи специальных инструментов можно узнать, какой код посылает сервер в ответ на запрос определенной страницы.

Некоторые страницы помещаются среди дополнительных результатов поиска из-за того, что сайт, на котором они находятся, имеет очень низкий PR и поэтому Google не испытывает большого доверия к их содержимому.

 

По материалам ветки форума Webmaster World.

Метки:

Добавить комментарий