Я работаю над механизмом рекомендаций, который использует совместный фильтр на основе элементов для создания рекомендаций для ресторанов. У каждого ресторана есть отзывы с рейтингом от 1 до 5.
Каждый алгоритм рекомендации борется с проблемой разреженности данных, поэтому я искал решения для расчета правильной корреляции.
Я использую скорректированное косинусное сходство между ресторанами.
Если вы хотите вычислить сходство между ресторанами, вам нужны пользователи, которые оценили оба ресторана. Но каким должно быть минимальное количество пользователей, которые оценили оба ресторана, чтобы получить правильную корреляцию?
В результате тестирования я обнаружил, что 1 группа пользователей, которые оценили оба ресторана, имеют плохое сходство (очевидно). Часто это -1 или 1. Поэтому я увеличил его до 2 групп пользователей, у которых есть оба ресторана, что дало мне большее сходство. Мне просто трудно определить, достаточно ли хорошо это сходство. Есть ли метод, который либо проверяет точность этого сходства, либо есть рекомендации о том, каков минимум?