Публикации по теме 'random-forest'


Накачайте это: предсказание
Часть вторая: моделирование данных Ранее я провел EDA данных водяного насоса для DrivenData: Pump It Up Challenge . Теперь данные готовы к использованию в алгоритме машинного обучения для прогнозирования того, какие насосы могут работать, а какие нуждаются в ремонте. Данные Загрузка и подготовка данных df = pd.read_csv(r'pump_model_data.csv') print(df.columns) Index(['funder', 'installer', 'scheme_management', 'extraction_type_group', 'quality_group', 'source_type',..

Полное руководство по случайным лесам: часть 1
Я слышу термин «Случайный лес» и сразу же представляю себе, как иду по роще секвойи, вдыхаю соленый прибрежный воздух и насыщенные ароматы леса. Однако сами случайные леса не так романтичны, как прогулка по секвойному лесу, пропитанному туманом залива. Случайные леса — это управляемый ансамблевый алгоритм обучения, основанный на деревьях решений. Если какие-либо из этих терминов вам незнакомы, не паникуйте! Эта статья, первая в серии из двух, проведет вас через простое, ясное и..

Случайный лес, настройка гиперпараметров и перекрестная проверка
Код Python: Ссылка на Github Как работает случайный лес? — Это Лес Деревьев!! 1. Просто это комбинация многих деревьев. 2. Всегда лучше принять больше предложений и принять решение о голосовании большинством, а не выдвигать одно предложение. Тот же принцип работает и в нашем Random Forest. 3. Таким образом снижается вероятность ошибки. 4. Итак, это работает аналогично дереву решений. 5. Количество деревьев является основным параметром, а остальные аналогичны дереву..

Здравствуйте друзья!
Здравствуйте друзья! Это моя первая статья о машинном обучении. ML — один из лучших доменов на сегодняшний день! Мне интересно узнать что-то в этой области! Я собираюсь рассказать вам о том, как появилась моя первая классификация машинного обучения. Извините за любые языковые проблемы! 😊 Начнем! Прежде всего, мне нужен был набор данных для предсказания. Для этого я использовал набор данных ниже. Это набор данных для оценок учащихся за 3 семестра. Он имеет 6 атрибутов и 10..

Случайный лес для задач классификации
В наших предыдущих подходах к линейной регрессии и логистической регрессии мы использовали одну модель и повышали точность модели, используя эту конкретную модель. Однако в случае ансамблевых моделей мы берем несколько моделей и пытаемся получить результат (может быть результат регрессии или результат логистической классификации). Затем эти модели объединяются для получения окончательного результата. Это очень похоже на то, как вы ищете голоса своих друзей для какого-то решения,..

Рекомендации по настройке гиперпараметров случайного леса
1. Введение 1.1 Эта статья для вас, если вы хотите: Поймите, какие гиперпараметры нужно настроить в Random Forest, и интуицию, стоящую за ними. Поймите, какая стратегия настройки является лучшей для каждого из них. Иметь предварительные знания о случайном лесу 2 Основные характеристики Random Forest для настройки 2.1 Обзор Random Forest имеет несколько гиперпараметров, но в целом они относятся к 3 основным характеристикам — количеству деревьев, глубине дерева и..

Все ансамбли в машинном обучении по порядку с иллюстрациями и тестами производительности
Пришло время разобраться, как они все работают, а главное, выяснить, какой из них лучший. Угадайте, сколько желейных бобов в этой банке? Профессор Джек Трейнор провел этот эксперимент в классе с банкой 850 бобов. В индивидуальном порядке большинство учащихся не приблизились к правильному ответу. Однако среднее количество предположений учащихся составило 871, что довольно близко. Этот пример иллюстрирует концепцию ансамблей в машинном обучении, где прогнозы из нескольких моделей..