Как связать термины (ключевые слова), которые имеют определенную связь между собой, через текстовые документы. Примером может служить google, когда вы ищете человека, он показывает рекомендации других людей, связанных с этим человеком.
На этом снимке показаны супруга, кандидат в президенты и равное положение.
Я использую метод подсчета частоты. Чем больше двух терминов встречается в одном документе, тем больше у них шансов иметь какое-либо отношение. Но это также связывает несвязанные термины, такие как метки страниц, глаголы и ссылки на страницы в текстовом документе.
Как мне его улучшить и есть ли другой простой, но надежный метод?