Я пытаюсь придумать рекомендательную систему на основе тем, чтобы предлагать пользователям релевантные текстовые документы.
Я обучил модель скрытой семантической индексации, используя gensim, на корпусе википедии. Это позволяет мне легко преобразовывать документы в тематические дистрибутивы LSI. Моя идея сейчас состоит в том, чтобы представить пользователей таким же образом. Однако, разумеется, у пользователей есть история просмотренных статей, а также оценки статей.
Итак, мой вопрос: как представлять пользователей?
Идея у меня была следующая: представить пользователя как совокупность всех просмотренных документов. Но как учитывать рейтинг?
Любые идеи?
Спасибо