выбор функции weka J48

Я использую Weka и применяю J48 для создания своего классификатора. У меня есть 40 функций с 2000 экземплярами (700 класса a и 1300 класса b).

Дерево решений J48 использует только 2 функции из 40! Можно ли разрешить J48 использовать все функции или есть какой-то другой алгоритм, позволяющий использовать все функции?

Заранее спасибо.


person Ahmad Azab    schedule 31.01.2013    source источник


Ответы (2)


Может быть, это потому, что J48 не нуждается в дополнительных атрибутах.

Вы можете проверить корреляцию объекта на вкладке Select attribute и запустить селектор с Ranker в качестве метода поиска и Principal Components в качестве оценщика. Он покажет вам отношения между каждой функцией и каждым классом, а также сообщит вам, какие функции лучше всего описывают ваши классы.

person arutaku    schedule 06.02.2013

Необязательно, чтобы для классификации требовались все 40 признаков. Потому что некоторые функции могут быть избыточными (например, коррелированными) или не содержать дискриминирующей информации.

Вы можете запустить выбор функций раньше на вкладке Select attributes в Weka Explorer и посмотреть, какие функции важны.

Также вы можете протестировать такие классификаторы, как SVM (libSVM или SMO), Neural Network (MultilayerPerceptron) и/или Random Forest, поскольку они обычно дают наилучшие результаты классификации (в зависимости от проблемы).

person iTech    schedule 06.02.2013