Я хотел бы найти важность каждой функции в моем кадре данных, используя обучение Scikit.
Я пытаюсь использовать его в обучении Scikit вместо использования Info Gain через программное обеспечение WEKA, которое предоставляет оценку и имя функции рядом с ней.
Я реализовал следующий метод, но не знаю, как заменить номер рейтинга в score.
Например:
Я не хочу видеть:
- особенность 6
- функция 4
...
Однако я предпочитаю:
0.4 особенность 6
0,233 функция 4
...
Вот мой метод:
def _rank_features(self, dataframe, targeted_class):
from sklearn.feature_selection import RFE
from sklearn.linear_model import LinearRegression
feature_names = list(dataframe.columns.values)
# use linear regression as the model
lr = LinearRegression()
# rank all features, i.e continue the elimination until the last one
rfe = RFE(lr, n_features_to_select=1)
rfe.fit(dataframe, targeted_class)
print "Features sorted by their rank:"
print sorted(zip(map(lambda x: round(x, 4), rfe.ranking_), feature_names))
Кто-нибудь знает, как преобразовать рейтинг в балл?