Пейджрейк — проблема

Я покажу вам 2 сценария (примечание: d=коэффициент демпфирования=0,5)

Первый сценарий: предположим, что у вас 4 узла A, B, C, D :

  • B, C, D ссылка на A.

PageRank: PR(A)=0.5 + 0.5*(PR(B)+PR(C)+PR(D))

Я могу решить это уравнение, поставив 0.25 на PR(B)=PR(C)=PR(D), и я получу значение 0,875. Мне не нужно разрешать какую-либо систему

Второй сценарий: предположим, что у вас 4 узла A, B, C, D :

  • A ссылка на B и C
  • B ссылка на C
  • C ссылка на A

Таким образом, PageRank будет:

PR(A)=0.5 + 0.5 * PR(C)

PR(B)=0.5 + 0.5 * ((PR(A))/(2))

PR(C)=0.5 + 0.5 * ((PR(A))/(2) + PR(B))

Я должен решить эту систему, чтобы получить результат. Я не ставлю 1/N на PR(A), PR(B), PR(C) and PR(D)

На самом деле, я ищу в Интернете решение, и значения:

$PR(A) = 14/13 = 1.07692308$

$PR(B) = 10/13 = 0.76923077$

$PR(C) = 15/13 = 1.15384615$

Итак, почему с двумя похожими сценариями я использую 2 разных поведения?

Надеюсь, кто-нибудь может мне помочь :) Ура


person markzzz    schedule 20.01.2011    source источник
comment
Хороший вопрос. Но это связано с математикой.   -  person shamittomar    schedule 20.01.2011
comment
Хм... есть какой-нибудь форум по математике, такой как StackOverflow? :)   -  person markzzz    schedule 20.01.2011
comment
Нашел математическое переполнение. Невероятно: нет тега PageRank o_O   -  person markzzz    schedule 20.01.2011
comment
math.stackexchange.com   -  person    schedule 20.01.2011
comment
Да, я разместил там тему, но, как я уже сказал, тега PageRank нет! :)   -  person markzzz    schedule 20.01.2011


Ответы (2)


Два сценария различны из-за симметрии в первой задаче: B, C и D ссылаются на одни и те же страницы и связаны с них (т. е. все они указывают на A, и ничто не указывает на них). Следовательно, их рейтинг страниц будет одинаковым, что дает вам дополнительное ограничение: PR(B)=PR(C)=PR(D), что позволяет легко решить проблему.

Вторая задача не имеет симметрии и должна решаться долго.

person Phil    schedule 20.01.2011

Предположим, что существует небольшая вселенная из четырех веб-страниц: A, B, C и D. Ссылки со страницы на саму себя или несколько исходящих ссылок с одной страницы на другую отдельную страницу игнорируются. PageRank инициализируется одним и тем же значением для всех страниц. В первоначальной форме PageRank сумма PageRank по всем страницам представляла собой общее количество страниц в Интернете в то время, поэтому каждая страница в этом примере имела бы начальный PageRank, равный 1. Однако более поздние версии PageRank и В оставшейся части этого раздела предполагается распределение вероятностей от 0 до 1. Следовательно, начальное значение для каждой страницы равно 0,25.

PageRank, передаваемый с данной страницы на цели ее исходящих ссылок, при следующей итерации делится поровну между всеми исходящими ссылками.

Если бы единственными ссылками в системе были ссылки со страниц B, C и D на A, каждая ссылка передала бы 0,25 PageRank на A при следующей итерации, что в сумме составило бы 0,75.

PR(A)= PR(B) + PR(C) + PR(D)

Вместо этого предположим, что на странице B есть ссылка на страницы C и A, на странице C есть ссылка на страницу A, а на странице D есть ссылки на все три страницы. Таким образом, на следующей итерации страница B перенесет половину своего существующего значения, или 0,125, на страницу A, а другую половину, или 0,125, на страницу C. Страница C передаст все свое существующее значение, 0,25, единственному страница, на которую она ссылается, A. Поскольку D имеет три исходящие ссылки, она передаст одну треть своего существующего значения, или примерно 0,083, A. По завершении этой итерации страница A будет иметь PageRank 0,458.

PR(A)= \frac{PR(B)}{2}+ \frac{PR(C)}{1}+ \frac{PR(D)}{3}.\,

Другими словами, PageRank, присваиваемый исходящей ссылкой, равен собственному показателю PageRank документа, деленному на количество исходящих ссылок L( ).

PR(A)= \frac{PR(B)}{L(B)}+ \frac{PR(C)}{L(C)}+ \frac{PR(D)}{L(D)}.

В общем случае значение PageRank для любой страницы u может быть выражено как:

PR(u) = \sum_{v \in B_u} \frac{PR(v)}{L(v)},

т. е. значение PageRank для страницы u зависит от значений PageRank для каждой страницы v, содержащихся в наборе Bu (наборе, содержащем все страницы, ссылающиеся на страницу u), деленном на количество L(v) ссылок со страницы v.

Для дальнейших запросов посетите здесь

person Jatinder Singh    schedule 19.10.2013