Статьи по теме sklearn

Публикации по теме 'sklearn'

Используйте SelectPercentile sklearn для выбора объектов в наборе данных сонара.

Выбор признаков в машинном обучении — это процесс уменьшения количества входных переменных при разработке прогностической модели. Желательно уменьшить количество входных признаков, чтобы снизить вычислительные затраты на моделирование и, в некоторых случаях, повысить производительность модели.

Как создать в sklearn два круга и делать на них прогнозы

Одна из замечательных особенностей ведущей библиотеки Python по машинному обучению заключается в том, что она содержит игрушечные наборы данных, которые могут создавать наборы данных. В своих предыдущих сообщениях я обсуждал, как создать набор данных с двумя лунами, а затем набор данных blob. Мой последний пост на эту тему о том, как создавать капли и делать на них прогнозы, можно найти здесь: - https://tracyrenee61.medium.com/how-to-create-a-dataset-of-blobs..

Обучение noBS: упражнение «Случайный лес»

Во-первых, нам нужны некоторые данные. Чтобы использовать реалистичный пример, я получил данные о погоде для Сиэтла, штат Вашингтон, за 2016 год, используя инструмент NOAA Climate Data Online. Как правило, около 80 % времени, затрачиваемого на анализ данных, уходит на очистку и извлечение данных, но эту рабочую нагрузку можно уменьшить, найдя высококачественные источники данных. Инструмент NOAA удивительно прост в использовании, а данные о температуре могут быть загружены в виде чистых..

День 59 из 100DaysofML

Пропустить перекрестную проверку . Это еще один метод перекрестной проверки, о котором я хотел упомянуть и рассказать. Это может быть сокращено как LOOCV и очень связано с K-fold. LOOCV — это метод перекрестной проверки, в котором размер складки равен «1», а «k» задается количеством наблюдений в данных. Этот вариант полезен, когда обучающие данные имеют ограниченный размер и количество тестируемых параметров ограничено. В случае использования sklearn для одного и того же процесса..

Давайте изучим ML: подробное руководство по алгоритму дерева решений

В первой части мини-серии #LetsLearnML мы рассмотрим алгоритм дерева решений и поймем его применение в ключевых случаях использования в бизнесе. Деревья решений обычно определяются как тип контролируемого обучения, используемый для классификации и регрессионного анализа. Они используют древовидную структуру узлов, ветвей и листьев для моделирования решений и их последствий. Кроме того, они непараметрические , что означает, что они не делают никаких предположений о распределении..

7 показателей оценки алгоритмов кластеризации

Подробное объяснение с примерами Python метрик оценки неконтролируемого обучения В контролируемом обучении метки известны, и оценку можно выполнить, вычислив степень правильности путем сравнения прогнозируемых значений с метками. Однако в неконтролируемом обучении метки неизвестны, что затрудняет оценку степени правильности, поскольку отсутствует истина . При этом по-прежнему непротиворечиво, что хороший алгоритм кластеризации имеет кластеры с малой дисперсией внутри кластера..

Прогнозирование сердечных приступов с помощью машинного обучения

Машинное обучение зарекомендовало себя как чрезвычайно полезный инструмент в мире науки, медицины, бизнеса и буквально во всех других приложениях, связанных с данными и желанием узнать, что может произойти в будущем. Здесь, в качестве кульминации методов, которые я изучил за последние несколько месяцев в своем курсе ML, ITP 449, я создаю коллекцию моделей для одного из самых классических применений ML — здоровья человека. В частности, я изучаю набор данных об сердечных приступах и ищу..