Публикации по теме 'decision-tree'
Демонстрация контролируемого алгоритма машинного обучения: дерево решений
Деревья решений — это мощные и широко используемые алгоритмы для решения задач классификации в контролируемом машинном обучении, поскольку они обладают способностью точно организовывать и упорядочивать различные классы. Думайте о дереве решений как о блок-схеме, которая ведет нас через серию решений для точной классификации точек данных. Древовидная структура начинается со «ствола», разветвляется на «ветви» и далее расширяется на «листья».
По мере того как мы перемещаемся по этому..
Как кодировать и оценивать деревья решений
В своем последнем блоге я обсуждал две наиболее распространенные метрики в деревьях решений: энтропию / прирост информации и индекс Джини. В этом посте я расскажу, как использовать Python для кодирования деревьев решений и опасностей, которые могут возникнуть при использовании деревьев решений.
Деревья решений кодирования
Чтобы начать кодирование наших деревьев, предположим, что у нас есть фрейм данных Pandas с именем df с категориальной целевой переменной. В дополнение к Pandas вы..
Деревья решений легко объясняются
Деревья решений (DT) - это непараметрический контролируемый метод обучения, используемый для классификации и регрессии. Деревья решений учатся на основе данных аппроксимировать синусоидальную кривую с помощью набора правил принятия решений «если-то-еще». Чем глубже дерево, тем сложнее правила принятия решений и точнее модель.
Дерево решений строит классификационные или регрессионные модели в виде древовидной структуры. Он разбивает набор данных на все меньшие и меньшие подмножества, в то..
Учебник по Титанику — Kaggle Challenge
Это блог о моем первом вызове на kaggle. Эта задача содержит данные о пассажирах титанического корабля, и мы хотим предсказать, кто выживет, а кто нет в наборе данных test.csv, изучив шаблоны из набора данных train.csv. Я сделал это с помощью алгоритма машинного обучения.
Данные
В файле train.csv содержится 891 точка данных, а в файле test.csv — 418. В данных поезда есть столбец «Выживший», который определяет, выжил ли человек или нет. Тот же столбец отсутствует в тестовом наборе..
AdaBoost, шаг за шагом
Введение в повышение и AdaBoost
AdaBoost относится к ансамблевым методам обучения и имитирует принцип «Мудрости толпы»: модели, которые по отдельности показывают низкую эффективность, могут образовывать сильную модель при объединении.
Исследование Массачусетского технологического института [ Diz21 ], опубликованное в 2021 году, описывает, как толпа способна распознавать фейковые новости. Без фоновых знаний или проверки фактов людям часто бывает трудно надежно идентифицировать..
Обнаружение мошенничества с кредитными картами
Ваша карта когда-нибудь была отклонена из-за подозрительной активности? Это попытка ИИ избежать убытков в размере 117 млн долларов США , вызванных мошенничеством, как в 2020 году. Такие ситуации смущают клиентов, и их следует избегать, но ослабление критериев ИИ позволит увеличить число случаев мошенничества. Вот почему важно правильно обучать и тестировать машину с правильным классификатором и данными. И это то, что мы постараемся сделать где.
Получение данных
Все данные доступны..
Что такое деревья решений?
Критерии принятия решений — это непараметрический контролируемый подход к обучению, используемый как для приложений классификации, так и для регрессии. Корневой узел, ветви, внутренние узлы и конечные узлы составляют его иерархическую древовидную структуру.
Корневой узел дерева решений, в котором отсутствуют входящие ветви, показан на диаграмме выше. Внутренние узлы, иногда называемые узлами принятия решений, питаются исходящими ветвями корневого узла. Оба типа узлов выполняют оценку..