PageRаnk и позиция в выдаче: немного статистики

Представляем вашему вниманию анонсированный перевод аналитического исследования поведения Google Toolbar Pagerank.

В течение нескольких последних месяцев команда HTML4SEO провела тысячи обзоров выдачи Google. В ходе каждого обзора мы проверяли PageRank, количество входящих ссылок а также HTML-контент страниц, входящих в первую сотню списка выдачи Google. Мы публикуем небольшое статистическое исследование, основанное на полученных данных, в сопровождении некоторых выводов.

Этот текст посвящен только параметру PageRank. В скором времени мы планируем опубликовать два других исследования, в которых будет рассмотрено значение входящих ссылок и свойств HTML-контента — двух других важнейших факторов SEO.

Эволюция PageRank в выдаче Google в течение последних 6 месяцев

Корреляция между ранжированием и параметром PageRank

Наиболее распространенным методом расчета корреляции ρXY между величинами X и Y является коэффициент корреляции Браве-Пирсона, нередко называемый просто коэффициентом корреляции.

Коэффициент корреляции ρXY может варьироваться в пределах от +1 до -1. Если ρXY= 1 корреляция считается полностью положительной, если -1 — полностью отрицательной. В обоих случаях, зная значение X, мы можем точно определить значение Y и наоборот. На графике этим коэффициентам будут соответствовать точки (X, Y), выстроенные по прямой линии, при этом график может возрастать (положительная корреляция) или убывать (отрицательная корреляция).

Если ρXY = 0, то между переменными X и Y нет линейной зависимости, при этом они могут быть полностью независимы друг от друга, или же между ними может существовать некая сложная, нелинейная зависимость.

В нашем случае величинам X и Y соответствует конечное ранжирование (позиция в выдаче Google) и коэффициент PageRank (по тулбару). Ниже приведены данные, собранные в ходе 1000 первых обзоров (100 лучших позиций в выдаче Google по запросам с количеством результатов больше 100), которые делались каждый месяц в период с мая по октябрь 2007 г.

2007 коэффициент корреляции
Май -0,85
Июнь -0,88
Июль -0,90
Август -0,88
Сентябрь -0,86
Октябрь -0,88
Среднее арифметическое -0,88
Стандартное отклонение 0,02

Комментарии:

1-е наблюдение. Коэффициент корреляции между ранжированием и PageRank близок к единице (в абсолютном выражении). Ранжирование и PageRank сильно коррелируют друг с другом. Высокий PageRank несомненно улучшает ранжирование.

2-е наблюдение. Коэффициент корреляции между ранжированием и PageRank демонстрирует высокую стабильность, имея среднее значение в 0,88 при стандартном отклонении в 2%. Вес параметра PageRank в рамках алгоритма ранжирования Google скорее всего не менялся. Ранжирование зависит от PageRank.

Утверждения типа «PageRank мертв!» или «PageRank имеет отношение только к маркетингу» не соответствуют действительности. PageRank не умер, его значение не уменьшилось до чисто маркетингового индикатора — он остается весьма существенной частью алгоритма ранжирования Google.

Линейная интерполяция ранжирования и PageRank

Теперь обратимся к линейной регрессии:

(Речь идет об анализе совокупности линейных функций типа f(x) = Ax + B, при этом коэффициент A, равный тангенсу угла наклона линии соответствующего графика, именуется в оригинальном тексте параметром «A slope», а коэффициент В, указывающий на ординату точки пересечения графика с осью Y – «B Y-intercept», смысл этого коэффициента – средний (по разным запросам) PageRank страницы занимающей первую позицию в выдаче; мы оставляем эти наименования без изменений, заключая их в кавычки для удобства чтения — Прим. пер.)

Линейная регрессия A slope В Y-intercept
Май y = -0,01x + 3,42 -0,01 3,42
Июнь y = -0,01x + 3,39 -0,01 3,39
Июль y = -0,01x + 3,31 -0,01 3,31
Август y = -0,01x + 3,20 -0,01 3,20
Сентябрь y = -0,01x + 3,15 -0,01 3,15
Октябрь y = -0,01x + 3,13 -0,01 3,13

Комментарии:

1-е наблюдение. Коэффициент «A Slope» (en.wikipedia.org/wiki/Linear_function) остается постоянным и равняется 100, что соответствует падению PageRank на 1 единицу при ухудшении ранжирования на 100 позиций. В течение последних нескольких месяцев эта картина оставалась неизменной.

2-е наблюдение. Коэффициент «B Y-intercept» (линейная интерполяция PageRank, соответствующего первому месту в выдаче) уменьшается. Другими словами, требования по параметру PageRank к сайтам, попадающим в топ выдачи Google, с каждым месяцем становятся все менее строгими.

Изменения Y-intercept линейной регрессии ранжирования и PageRank

Распределение значений Y-intercept линейной регрессии по временной шкале, охватывающей период с мая по октябрь 2007 г., демонстрирует корреляцию в -0,98, что является признаком очень тесной линейной зависимости между двумя переменными. Соответствующая линейная регрессия выражается формулой y = -0,07x + 3,49. Из нее можно без труда вывести, что требования по PageRank к сайтам, попадающим в топ выдачи, уменьшаются на 1 единицу PageRank каждые 14 месяцев.

К представленным результатам следует относиться с известной долей сомнения. Они были получены статистическим методом, следовательно их можно рассматривать лишь как индикатор самых общих тенденций — не более того. И все же они представляют немалый интерес.

Чем может быть обусловлено падение PageRank в выдаче Google?

По мере роста всемирной сети количество релевантных документов с низким PageRank увеличивается. Среди огромного корпуса доступных страниц всегда найдется значительное число документов, выделяющихся своим качеством, но вместе с тем имеющих низкий PageRank и малое количество входящих ссылок. Это обстоятельство по-новому ставит вопрос о семантической релевантности возвращаемых Google страниц.

Возможно, несколько месяцев назад Google попросту начал отслеживать сайты на предмет подозрительных (black hat) входящих ссылок. Ссылок, которые рассматриваются как благонадежные, становится все меньше и меньше и прежние лидеры выдачи сменились прошлыми аутсайдерами с меньшим количеством обратных ссылок (и соответственно PageRank) зато их более высоким «качеством».
Такие изменения значения Pagerank сайтов из выдачи Google могли стать возможными потому что алгоритм вычисления Pagerank глобальный и учитывает все ссылки, а не только ссылки между тематически близкими сайтами.

Или: несколько месяцев назад началась масштабная рекалибровка PageRank (кое-кто высказывал и такое предположение). Недавний апдейт индикатора, заметный невооруженным глазом, подтверждает эту гипотезу, поскольку процесс рекалибровки должен включать в себя глобальное падение PageRank до квази-начального уровня.

Вероятно, существует множество других гипотез…

PageRank в ноябре 2007 г.

Похоже, что в ходе этого месяца произошли более радикальные изменения, нежели в течение нескольких предыдущих месяцев. У кого-то PageRank вырос сразу на 3 пункта, у кого-то — упал на эту же величину. При этом изменения PageRank носят нелинейный характер. Поскольку между конечным ранжированием и значением PageRank существует очень сильная корреляция, те, у кого PageRank обвалился, имеют вполне реальную почву для беспокойства. За уменьшением PageRank непременно последует потеря позиций в выдаче Google и, как следствие, сокращение трафика.

Мы будем внимательно следить за эволюцией индикатора PageRank в следующем месяце

Источник: www.html4seo.com/seo-pdf/google-pagerank-serp-statistics.pdf

Метки:,

Добавить комментарий