Я хотел сравнить adaboost
и деревья решений. В качестве доказательства принципа я установил количество оценщиков в adaboost
на 1
с классификатором дерева решений по умолчанию, ожидая того же результата, что и простое дерево решений.
Я действительно с такой же точностью предсказал свои тестовые метки. Однако время подгонки для adaboost
намного меньше, а время тестирования немного больше. Adaboost
, похоже, использует те же настройки по умолчанию, что и DecisionTreeClassifier
, иначе точность не была бы такой же.
Кто-нибудь может это объяснить?
Код
from sklearn.ensemble import AdaBoostClassifier
from sklearn.tree import DecisionTreeClassifier
from sklearn.metrics import accuracy_score
print("creating classifier")
clf = AdaBoostClassifier(n_estimators = 1)
clf2 = DecisionTreeClassifier()
print("starting to fit")
time0 = time()
clf.fit(features_train,labels_train) #fit adaboost
fitting_time = time() - time0
print("time for fitting adaboost was", fitting_time)
time0 = time()
clf2.fit(features_train,labels_train) #fit dtree
fitting_time = time() - time0
print("time for fitting dtree was", fitting_time)
time1 = time()
pred = clf.predict(features_test) #test adaboost
test_time = time() - time1
print("time for testing adaboost was", test_time)
time1 = time()
pred = clf2.predict(features_test) #test dtree
test_time = time() - time1
print("time for testing dtree was", test_time)
accuracy_ada = accuracy_score(pred, labels_test) #acc ada
print("accuracy for adaboost is", accuracy_ada)
accuracy_dt = accuracy_score(pred, labels_test) #acc dtree
print("accuracy for dtree is", accuracy_dt)
Вывод
('time for fitting adaboost was', 3.8290421962738037)
('time for fitting dtree was', 85.19442415237427)
('time for testing adaboost was', 0.1834099292755127)
('time for testing dtree was', 0.056527137756347656)
('accuracy for adaboost is', 0.99089874857792948)
('accuracy for dtree is', 0.99089874857792948)
features_train
? когда я повторяю ваш эксперимент со 100 трехмерными образцами, дерево решений примерно в 10 раз быстрее, чем Adaboost. - person Itamar Katz   schedule 12.11.2016%prun
IPython - хороший вариант. - person Itamar Katz   schedule 12.11.2016