Я действительно заинтересован в том, чтобы мой GP основывался на разработке такого алгоритма ранжирования страниц, а не на создании собственной поисковой системы.
Есть ли способ проверить мой алгоритм без поисковой системы?
Я действительно заинтересован в том, чтобы мой GP основывался на разработке такого алгоритма ранжирования страниц, а не на создании собственной поисковой системы.
Есть ли способ проверить мой алгоритм без поисковой системы?
Предполагая, что вы заинтересованы в тестировании этого в Интернете, поскольку большинство наборов данных, не связанных с Интернетом, не так интересны с точки зрения PageRank:
commoncrawl.org имеет веб-сканер, который вы можете относительно недорого обработать в AWS; это могло бы избавиться от большого количества работы по пути.