Алгоритм ранжирования страницы

Я действительно заинтересован в том, чтобы мой GP основывался на разработке такого алгоритма ранжирования страниц, а не на создании собственной поисковой системы.

Есть ли способ проверить мой алгоритм без поисковой системы?


person M.SW    schedule 13.10.2012    source источник


Ответы (1)


Предполагая, что вы заинтересованы в тестировании этого в Интернете, поскольку большинство наборов данных, не связанных с Интернетом, не так интересны с точки зрения PageRank:

commoncrawl.org имеет веб-сканер, который вы можете относительно недорого обработать в AWS; это могло бы избавиться от большого количества работы по пути.

person Greg Lindahl    schedule 14.10.2012