Статьи по теме decision-tree

Публикации по теме 'decision-tree'

Демонстрация контролируемого алгоритма машинного обучения: дерево решений

Деревья решений — это мощные и широко используемые алгоритмы для решения задач классификации в контролируемом машинном обучении, поскольку они обладают способностью точно организовывать и упорядочивать различные классы. Думайте о дереве решений как о блок-схеме, которая ведет нас через серию решений для точной классификации точек данных. Древовидная структура начинается со «ствола», разветвляется на «ветви» и далее расширяется на «листья». По мере того как мы перемещаемся по этому..

Как кодировать и оценивать деревья решений

В своем последнем блоге я обсуждал две наиболее распространенные метрики в деревьях решений: энтропию / прирост информации и индекс Джини. В этом посте я расскажу, как использовать Python для кодирования деревьев решений и опасностей, которые могут возникнуть при использовании деревьев решений. Деревья решений кодирования Чтобы начать кодирование наших деревьев, предположим, что у нас есть фрейм данных Pandas с именем df с категориальной целевой переменной. В дополнение к Pandas вы..

Деревья решений легко объясняются

Деревья решений (DT) - это непараметрический контролируемый метод обучения, используемый для классификации и регрессии. Деревья решений учатся на основе данных аппроксимировать синусоидальную кривую с помощью набора правил принятия решений «если-то-еще». Чем глубже дерево, тем сложнее правила принятия решений и точнее модель. Дерево решений строит классификационные или регрессионные модели в виде древовидной структуры. Он разбивает набор данных на все меньшие и меньшие подмножества, в то..

Учебник по Титанику — Kaggle Challenge

Это блог о моем первом вызове на kaggle. Эта задача содержит данные о пассажирах титанического корабля, и мы хотим предсказать, кто выживет, а кто нет в наборе данных test.csv, изучив шаблоны из набора данных train.csv. Я сделал это с помощью алгоритма машинного обучения. Данные В файле train.csv содержится 891 точка данных, а в файле test.csv — 418. В данных поезда есть столбец «Выживший», который определяет, выжил ли человек или нет. Тот же столбец отсутствует в тестовом наборе..

AdaBoost, шаг за шагом

Введение в повышение и AdaBoost AdaBoost относится к ансамблевым методам обучения и имитирует принцип «Мудрости толпы»: модели, которые по отдельности показывают низкую эффективность, могут образовывать сильную модель при объединении. Исследование Массачусетского технологического института [ Diz21 ], опубликованное в 2021 году, описывает, как толпа способна распознавать фейковые новости. Без фоновых знаний или проверки фактов людям часто бывает трудно надежно идентифицировать..

Обнаружение мошенничества с кредитными картами

Ваша карта когда-нибудь была отклонена из-за подозрительной активности? Это попытка ИИ избежать убытков в размере 117 млн долларов США , вызванных мошенничеством, как в 2020 году. Такие ситуации смущают клиентов, и их следует избегать, но ослабление критериев ИИ позволит увеличить число случаев мошенничества. Вот почему важно правильно обучать и тестировать машину с правильным классификатором и данными. И это то, что мы постараемся сделать где. Получение данных Все данные доступны..

Что такое деревья решений?

Критерии принятия решений — это непараметрический контролируемый подход к обучению, используемый как для приложений классификации, так и для регрессии. Корневой узел, ветви, внутренние узлы и конечные узлы составляют его иерархическую древовидную структуру. Корневой узел дерева решений, в котором отсутствуют входящие ветви, показан на диаграмме выше. Внутренние узлы, иногда называемые узлами принятия решений, питаются исходящими ветвями корневого узла. Оба типа узлов выполняют оценку..