Код Python: Ссылка на Github

Как работает случайный лес? — Это Лес Деревьев!!

1. Просто это комбинация многих деревьев.

2. Всегда лучше принять больше предложений и принять решение о голосовании большинством, а не выдвигать одно предложение. Тот же принцип работает и в нашем Random Forest.

3. Таким образом снижается вероятность ошибки.

4. Итак, это работает аналогично дереву решений.

5. Количество деревьев является основным параметром, а остальные аналогичны дереву решений.

Как узнать оптимальные параметры при высокой производительности модели?

1. А вот и настройка гиперпараметров для повышения производительности модели.

2. Существует два типа настройки гиперпараметров. i) поиск по сетке и ii) рандомизированный поиск.

3. Для обоих типов мы должны указать диапазоны параметров и алгоритм поиска в этих диапазонах и получить оптимальные параметры.

4. Поиск по сетке ищет в равной сетке, тогда как рандомизированный поиск ищет случайным образом.

Как наш алгоритм оценивает и выдает оптимальные параметры?

1. Здесь на помощь приходит перекрестная проверка.

2. Наш алгоритм делит всю обучающую выборку на k сгибов и обучает модель с параметрами на k-1 сгибах и тестирует на оставшемся 1 сгибе.

3. Это дает нам точность модели с параметрами. Таким образом, алгоритм оценивает и находит оптимальные параметры.