Код Python: Ссылка на Github
Как работает случайный лес? — Это Лес Деревьев!!
1. Просто это комбинация многих деревьев.
2. Всегда лучше принять больше предложений и принять решение о голосовании большинством, а не выдвигать одно предложение. Тот же принцип работает и в нашем Random Forest.
3. Таким образом снижается вероятность ошибки.
4. Итак, это работает аналогично дереву решений.
5. Количество деревьев является основным параметром, а остальные аналогичны дереву решений.
Как узнать оптимальные параметры при высокой производительности модели?
1. А вот и настройка гиперпараметров для повышения производительности модели.
2. Существует два типа настройки гиперпараметров. i) поиск по сетке и ii) рандомизированный поиск.
3. Для обоих типов мы должны указать диапазоны параметров и алгоритм поиска в этих диапазонах и получить оптимальные параметры.
4. Поиск по сетке ищет в равной сетке, тогда как рандомизированный поиск ищет случайным образом.
Как наш алгоритм оценивает и выдает оптимальные параметры?
1. Здесь на помощь приходит перекрестная проверка.
2. Наш алгоритм делит всю обучающую выборку на k сгибов и обучает модель с параметрами на k-1 сгибах и тестирует на оставшемся 1 сгибе.
3. Это дает нам точность модели с параметрами. Таким образом, алгоритм оценивает и находит оптимальные параметры.