Мне было интересно, есть ли хорошая и чистая реализация объектно-ориентированного программирования (ООП) байесовской фильтрации для спама и классификации текста? Это только для целей обучения.
Объектно-ориентированная байесовская фильтрация спама?
Ответы (6)
Я определенно рекомендую Weka, которая является программным обеспечением для интеллектуального анализа данных с открытым исходным кодом< /em> написано на Java:
Weka — это набор алгоритмов машинного обучения для задач интеллектуального анализа данных. Алгоритмы можно либо применять непосредственно к набору данных, либо вызывать из вашего собственного кода Java. Weka содержит инструменты для предварительной обработки данных, классификации, регрессии, кластеризации, правил ассоциации и визуализации. Он также хорошо подходит для разработки новых схем машинного обучения.
Как упоминалось выше, он поставляется с набором различных классификаторов, таких как SVM, Winnow, C4.5, наивный байесовский анализ (конечно) и многие другие (см. документ API). Обратите внимание, что многие классификаторы, как известно, имеют намного лучшую производительность, чем наивный байесовский алгоритм в области обнаружения спама или классификации текста.
Кроме того, Weka предоставляет вам очень мощный графический интерфейс пользователя…
Ознакомьтесь с главой 6 Программирование коллективного разума
Возможно, https://ci-bayes.dev.java.net/ или http://www.cs.cmu.edu/~javabayes/Home/node2.html а>?
Я тоже никогда с ним не играл.
Вот реализация байесовской фильтрации на C#: Наивный байесовский спам-фильтр для C# (размещено на CodeProject).
На французском языке, но вы сможете найти ссылку для скачивания :) Наивный байесовский фильтр PHP