Публикации по теме 'modeling'
Изучаем науку о данных: день 7 — Предвзятость
Я лично планирую узнать о регрессии. Однако я думаю, что мне все еще не хватает знаний о том, что делать с наборами данных. Итак, я думаю, мне лучше перейти к другим темам, посвященным тому, как обрабатывать данные в наборе данных. И сегодня мы поговорим о Bias.
Что такое предвзятость?
Я нашел комикс, который представляет определение предвзятости.
Таким образом, предвзятость — это все, что ведет нас непосредственно к выводу, а не к объективному отношению к данным. Одним из..
Уловки, чтобы справиться с классовым дисбалансом, часть - I
Давайте обсудим следующие методы обработки дисбаланса классов для задачи прогнозирования двоичного класса:
Параметр class_weight в Scikit-Learn SMOTE Увеличение показателя f1 с помощью пороговых значений Минимизация функции мягких потерь f1 напрямую с помощью нейронной сети (NN)
Данные: обнаружение мошенничества с кредитными картами
Используемые модели: логистическая регрессия и NN
Тип: проблема двоичного прогнозирования (подлинность - 0, мошенничество - 1)..
Конструктивистское машинное обучение
Видение приближения машинного обучения к людям
Есть ли способ конструктивистски переосмыслить машинное обучение? И что еще более важно, зачем нам это делать?
Ответы на оба вопроса довольно просты. Да, мы можем это сделать, и мотивация для этого может устранить один из критических недостатков современного машинного обучения, то есть приблизить его к человеческой интерпретации реальности.
Ключевым компонентом когнитивной функциональности является модель.
Люди могут строить очень..
больницы, паническое население и изменить жизнь.
COVID-19 представляет собой самую серьезную проблему инфекционного заболевания, с которой мы сталкивались более чем за столетие. Если прогнозы верны, этот вирус приведет к огромным потерям в виде смертей, госпитализаций и нарушений. Это вызовет стресс у больниц, вызовет панику среди населения и изменит жизнь. Поставщики медицинских услуг не только будут инфицированы, но и столкнутся с непостижимыми решениями в условиях, когда стандарты лечения могут быть изменены...
Зачем превращать в рассол?
Что такое рассол
Pickle - это модуль Python, используемый для сериализации объекта Python в двоичный формат и десериализации его обратно в объект Python.
Два важных случая использования рассола
Первый случай:
Вы работаете над проблемой машинного обучения, используя любимый: jupyter notebook . Вы проанализировали данные и определили основные особенности, которые помогут вашей модели. Вы выполняете разработку функций и знаете, что это будут окончательные данные, которые вы..
Моделирование как доказательство концепции (POC)
Моделирование как доказательство концепции (POC)
Почему я отдаю предпочтение построению модели как Proof of Concept (POC) вместо того, чтобы следовать установленным методологиям, таким как CRISP-DM, SEMMA, AIE, MAD Skills и т. д.?
Несмотря на то, что большинство ученых, занимающихся данными, скажут, что это две разные вещи, которые используются для разных целей; один представляет собой методологию или пошаговый подход к созданию работоспособной модели, а другой — проверку вашей идеи,..
Почему машинное обучение требует сводной статистики
Как дела, парни! В этой статье мы поговорим о том, почему сводная статистика является неотъемлемой частью любого проекта по машинному обучению. Мы надеемся упростить задачу, предоставив вам список из 4 причин для проведения сводного статистического анализа, прежде чем применять какие-либо модели машинного обучения.
Вторая цель — показать вам, ребята, что хорошо работает при подготовке к развертыванию моделей машинного обучения с точки зрения сводной статистики.
1. В ваших данных..