Объектно-ориентированная байесовская фильтрация спама?

Мне было интересно, есть ли хорошая и чистая реализация объектно-ориентированного программирования (ООП) байесовской фильтрации для спама и классификации текста? Это только для целей обучения.


person gyurisc    schedule 04.08.2008    source источник


Ответы (6)


Я определенно рекомендую Weka, которая является программным обеспечением для интеллектуального анализа данных с открытым исходным кодом< /em> написано на Java:

Weka — это набор алгоритмов машинного обучения для задач интеллектуального анализа данных. Алгоритмы можно либо применять непосредственно к набору данных, либо вызывать из вашего собственного кода Java. Weka содержит инструменты для предварительной обработки данных, классификации, регрессии, кластеризации, правил ассоциации и визуализации. Он также хорошо подходит для разработки новых схем машинного обучения.

Как упоминалось выше, он поставляется с набором различных классификаторов, таких как SVM, Winnow, C4.5, наивный байесовский анализ (конечно) и многие другие (см. документ API). Обратите внимание, что многие классификаторы, как известно, имеют намного лучшую производительность, чем наивный байесовский алгоритм в области обнаружения спама или классификации текста.

Кроме того, Weka предоставляет вам очень мощный графический интерфейс пользователя

person Benedikt Waldvogel    schedule 03.09.2008

Ознакомьтесь с главой 6 Программирование коллективного разума

person Binil Thomas    schedule 01.09.2008


Вот реализация байесовской фильтрации на C#: Наивный байесовский спам-фильтр для C# (размещено на CodeProject).

person Yaakov Ellis    schedule 04.08.2008

nBayes — еще одна реализация C#, размещенная на CodePlex.

person Joel Martinez    schedule 08.05.2009

На французском языке, но вы сможете найти ссылку для скачивания :) Наивный байесовский фильтр PHP

person Vincent Robert    schedule 04.08.2008