Публикации по теме 'random-forest'
Математика деревьев решений, случайный лес и важность функций в Scikit-learn и Spark
Введение
В этом посте делается попытка консолидировать информацию об алгоритмах дерева и их реализациях в Scikit-learn и Spark. В частности, он был написан для разъяснения того, как рассчитывается важность функции.
В Интернете есть много замечательных ресурсов, в которых обсуждается, как создаются деревья решений и случайные леса, и этот пост не предназначен для этого. Хотя он включает короткие определения контекста, предполагается, что читатель понимает эти концепции и желает..
Случайный лес для несбалансированного набора данных: пример с лавинами во французских Альпах
Как оценить и улучшить производительность Random Forest с сильно несбалансированными данными? Давайте посмотрим на пример схода лавин во французских Альпах.
Содержание
1) Введение в показатели производительности для несбалансированных наборов данных 2) Случайный лес (RF) для лавин во Французских Альпах: почему отзыв важнее точности? 2.1) Снижение дискретизации для повышения производительности модели RF 2.2) Выбор функций для повышения производительности модели RF..
Методы машинного обучения с контролируемым произвольным лесом
В наши дни у всех есть iPhone (кроме меня, я все еще любитель Android), и вы когда-нибудь задумывались, как ваш телефон может разблокироваться сам по себе, когда вы кладете его перед лицом? Или вы видели те фильмы, где детектив просматривает фотографию антагониста по базам данных и сопоставляет профиль? Что ж, если вы это сделаете, то вы попали в нужное место, потому что я на самом деле собираюсь объяснить вам, как это делается. Реализовать это проще, чем вы могли представить. Все, что..
E-Классификация предупреждений о наблюдении
Оглавление
Бизнес-проблема Постановка задачи Реальные цели и ограничения Сопоставление реальной проблемы с проблемой машинного обучения Прочитать данные Предварительная обработка данных Построение модели машинного обучения Вывод
1. Бизнес-проблема
Описание:
Предотвращайте взломы до того, как они произойдут, с помощью камер безопасности IoT со встроенными возможностями компьютерного зрения, что снижает потребность во вмешательстве человека. Автоматизированная система..
Введение в случайный лес
Random Forest работает как с классификацией, так и с регрессией как с постановкой задачи.
Случайный лес использует число N деревьев решений в качестве базовой модели и предоставляет некоторую выборку данных каждому дереву решений для прогнозирования.
если вы не знаете о блогах DT 1 , 2 .
для классификации случайный лес берет каждый вывод дерева решений и голосует за тот класс, который имеет наибольшее количество голосов, и принимает его в качестве вывода.
для регрессии..
Оптимизация гиперпараметров в классификации случайных лесов
Что такое гиперпараметры, как выбирать значения гиперпараметров и стоят ли они вашего времени
В этом посте я подробно рассмотрю настройку гиперпараметров для моделей случайной классификации лесов с использованием нескольких пакетов scikit-learn для классификации и выбора моделей. Я буду анализировать наборы данных о качестве вина из Репозитория машинного обучения UCI . Для этого поста я объединил отдельные наборы данных для красного и белого вина и назначил им дополнительный столбец,..
Дерево решений против случайного леса
Этот блог посвящен результатам и наблюдениям за работой в Дереве решений и Случайном лесу.
Нажмите здесь , чтобы проверить код и условие проблемы.
Часть А:
Точность обеих моделей кажется довольно близкой. Но точность в случайном лесу немногим лучше, чем в дереве решений. Скорость на дереве решений кажется немного лучше, поскольку случайный лес должен рассчитывать для нескольких деревьев.
Часть Б:
Режим выбора значений:
Значения выбираются как раз в точке, где..