Публикации по теме 'random-forest'


One-Hot Encoding ухудшает ваши древовидные ансамбли, вот почему?
Оптимизация древовидных моделей Я учусь в магистратуре в области науки о данных в Университете Вирджинии и работаю над множеством проектов по машинному обучению. Каждую неделю я буду решать одну проблему, с которой столкнулся при работе над проектом, и предлагать практическое решение. Большинство реальных наборов данных представляют собой смесь категориальных и непрерывных переменных. Хотя непрерывные переменные довольно легко вписываются во все модели машинного обучения,..

Расширенные алгоритмы машинного обучения
В машинном обучении есть много алгоритмов, в которых мы сейчас видим, что такое случайный Форрест, деревья решений. Что такое деревья решений? Дерево решений — это метод контролируемого обучения, используемый для решения задач классификации и регрессии. Он принимает данные и по правилам принятия решений обеспечивает вывод. Вот простое дерево решений с конкретным выходом. Если человеку меньше 30 лет и он ест много пиццы, значит, он нездоров. Мы можем решить, насколько глубоким..

Использование случайных лесов для каталогизации мнений о моих глупых фильмах о Бэтмене, часть 1: деревья решений.
Примечание. Первоначально текст был написан в августе 2019 года, до выхода фильма "Джокер". Клянусь, я собирался написать о чем-то важном. Исследуя, как машинное обучение можно использовать для борьбы с бедностью, я наткнулся на несколько статей Всемирного банка, в которых описывается, как использование машинного обучения случайного леса может помочь повысить точность опросов по прогнозированию бедности. Я уже собирался писать на эту тему, когда понял, что понятия не имею, что такое..

Оценка моделей классификации + удобная функция для диагностики
Это обзор основных способов оценки результатов алгоритмов классификации. Чтобы прояснить эту тему, я буду использовать примеры из своего проекта, основанного на наборе данных с Airbnb, который можно найти на Kaggle . Я отклонился от первоначального конкурса и решил, что моя цель - предсказать, сделает ли пользователь Airbnb бронирование или нет. Модель, которая может классифицировать таких пользователей, может помочь оптимизировать цифровой маркетинг! Матрица неточностей Матрица..

Очень известный компромисс между смещением и дисперсией! Что это??
В интервью меня спросили, в чем разница между случайным лесом и классификатором дерева решений. Я много рассказывал ему о них обоих, но ответ, которого он с нетерпением ждал, был «Компромисс смещения и дисперсии». Хотя я не полностью согласен именно с этим ответом, я сосредоточусь на том, чтобы написать и объяснить то же самое в этом посте. Смещение - термин, используемый для определения того, насколько прогнозируемые точки данных совпадают с фактическими точками данных, или разница..

Деревья решений, случайные леса и PCA
В нынешнем безумстве глубокого обучения может быть меньше внимания к некоторым из хорошо известных методов, хотя они очень полезны для небольших проектов машинного обучения, над которыми можно было бы работать. Это сообщение в блоге направлено на освещение важных концепций и приемов, связанных со следующими методами: Деревья решений Ансамблевое обучение (случайные леса) Проклятие размерности Содержание этого сообщения представляет собой краткое изложение важных моментов, которые я..

Изучение последних тенденций случайного леса
"Машинное обучение" Изучение последних тенденций случайного леса Модель случайного леса считается одной из многообещающих ансамблевых моделей машинного обучения, которая в последнее время стала очень популярной. В этом посте мы рассмотрим последние тенденции случайного леса. Модели ансамбля - вступление Ансамбль рассматривает несколько моделей обучения и объединяет их для получения более мощной модели. Объединение различных моделей в ансамбль приводит к лучшему обобщению..