Публикации по теме 'modeling'


Изучаем науку о данных: день 7 — Предвзятость
Я лично планирую узнать о регрессии. Однако я думаю, что мне все еще не хватает знаний о том, что делать с наборами данных. Итак, я думаю, мне лучше перейти к другим темам, посвященным тому, как обрабатывать данные в наборе данных. И сегодня мы поговорим о Bias. Что такое предвзятость? Я нашел комикс, который представляет определение предвзятости. Таким образом, предвзятость — это все, что ведет нас непосредственно к выводу, а не к объективному отношению к данным. Одним из..

Уловки, чтобы справиться с классовым дисбалансом, часть - I
Давайте обсудим следующие методы обработки дисбаланса классов для задачи прогнозирования двоичного класса: Параметр class_weight в Scikit-Learn SMOTE Увеличение показателя f1 с помощью пороговых значений Минимизация функции мягких потерь f1 напрямую с помощью нейронной сети (NN) Данные: обнаружение мошенничества с кредитными картами Используемые модели: логистическая регрессия и NN Тип: проблема двоичного прогнозирования (подлинность - 0, мошенничество - 1)..

Конструктивистское машинное обучение
Видение приближения машинного обучения к людям Есть ли способ конструктивистски переосмыслить машинное обучение? И что еще более важно, зачем нам это делать? Ответы на оба вопроса довольно просты. Да, мы можем это сделать, и мотивация для этого может устранить один из критических недостатков современного машинного обучения, то есть приблизить его к человеческой интерпретации реальности. Ключевым компонентом когнитивной функциональности является модель. Люди могут строить очень..

больницы, паническое население и изменить жизнь.
COVID-19 представляет собой самую серьезную проблему инфекционного заболевания, с которой мы сталкивались более чем за столетие. Если прогнозы верны, этот вирус приведет к огромным потерям в виде смертей, госпитализаций и нарушений. Это вызовет стресс у больниц, вызовет панику среди населения и изменит жизнь. Поставщики медицинских услуг не только будут инфицированы, но и столкнутся с непостижимыми решениями в условиях, когда стандарты лечения могут быть изменены...

Зачем превращать в рассол?
Что такое рассол Pickle - это модуль Python, используемый для сериализации объекта Python в двоичный формат и десериализации его обратно в объект Python. Два важных случая использования рассола Первый случай: Вы работаете над проблемой машинного обучения, используя любимый: jupyter notebook . Вы проанализировали данные и определили основные особенности, которые помогут вашей модели. Вы выполняете разработку функций и знаете, что это будут окончательные данные, которые вы..

Моделирование как доказательство концепции (POC)
Моделирование как доказательство концепции (POC) Почему я отдаю предпочтение построению модели как Proof of Concept (POC) вместо того, чтобы следовать установленным методологиям, таким как CRISP-DM, SEMMA, AIE, MAD Skills и т. д.? Несмотря на то, что большинство ученых, занимающихся данными, скажут, что это две разные вещи, которые используются для разных целей; один представляет собой методологию или пошаговый подход к созданию работоспособной модели, а другой — проверку вашей идеи,..

Почему машинное обучение требует сводной статистики
Как дела, парни! В этой статье мы поговорим о том, почему сводная статистика является неотъемлемой частью любого проекта по машинному обучению. Мы надеемся упростить задачу, предоставив вам список из 4 причин для проведения сводного статистического анализа, прежде чем применять какие-либо модели машинного обучения. Вторая цель — показать вам, ребята, что хорошо работает при подготовке к развертыванию моделей машинного обучения с точки зрения сводной статистики. 1. В ваших данных..