Публикации по теме 'imbalanced-dataset'


Sparkify Прогноз оттока
Введение Проблема потери клиентов является серьезной проблемой почти для каждой сервисной компании, основной причиной которой является стоимость привлечения новых клиентов, которая часто намного выше, чем удержание существующих. В результате возможность прогнозирования оттока может помочь компаниям принять меры в отношении клиентов, которые, скорее всего, уйдут, например, программы удержания. Модели машинного обучения, основанные на исторических данных, можно использовать для сбора..

Управление весами классов и порогом принятия решения
Сравнение двух методов сохранения баланса в классификации Контекст: Обработка дисбаланса набора данных в задачах классификации - очень горячая тема в сообществе машинного обучения (ML). Здесь мы имеем в виду несбалансированность доли выборок для каждого класса ответов. Проходя через ISLR Джеймса, Виттена, Хасти, Тибширани - я натолкнулся на этот момент, и подход к устранению неблагоприятных последствий таких дисбалансов заключается в манипулировании пороговым пределом вероятности,..