Публикации по теме 'predictive-modeling'


Спецификация экстремальных значений/значений по умолчанию в Scikit-Learn и PMML с использованием ContinuousDomain()
Спецификация экстремальных значений/значений по умолчанию в Scikit-Learn и PMML с использованием ContinuousDomain Часто разработчик модели хочет ограничить диапазон значений, которыми может быть предиктор. Например, многие переменные реальной жизни, такие как доход или время до завершения, обычно имеют логарифмически нормальное распределение. Разработчик модели может не захотеть, чтобы сверхвысокое значение некоторых переменных подавляло другие переменные в модели для прогнозов...

ЧМ-2022 КАТАР: Победители ГРУППОВОГО ЭТАПА, о которых вы не знали!
Обзор проекта 20 ноября 2022 года стало чрезвычайно важным днем ​​для любителей футбола во всем мире. Этот день знаменует собой начало чемпионата мира по футболу 2022 года, и впервые его принимает Катар , который является маленькой страной, но больше, чем вы когда-либо думали. В течение последних 12 лет Катар готовился к тому, чтобы эта версия стала не только самой дорогой с точки зрения инвестиций в стадионы, инфраструктуру, транспорт и отели, но и самой исключительной из всех..

Что такое машинное обучение?
Что такое машинное обучение? Узнав, как работает машинное обучение, вы будете готовы изучить возможности использования искусственного интеллекта в будущем. Машинное обучение - это изучение алгоритмов и моделей статистических данных, которые компьютеры используют для выполнения конкретной задачи без явных инструкций, полагаясь на шаблоны и логические выводы. Алгоритмы машинного обучения создают математические модели на основе данных, называемых «обучающими данными», для..

Прогнозирование преступности в Чикаго с помощью погоды
Как прогнозировать уличную преступность в Чикаго по погоде. Я живу в районе Чикаго более 15 лет, и когда я думаю об этом городе, я думаю о глубокой пицце, блюзовой музыке, отличной еде, ветре, холода… и преступности. Преступление - это просто часть жизни здесь. Я видел, как многие люди писали о преступности в Чикаго и составляли подробные диаграммы, графики и отчеты, но я никогда не видел, чтобы кто-то пытался предсказать преступление в Чикаго. Это новая территория, и я готов к этой..

Прогнозирование наличия 200 миллионов продуктовых товаров в магазинах Северной Америки в режиме реального времени.
Вы когда-нибудь мечтали о том, чтобы узнать, продается ли ваш любимый аромат мороженого «Бен и Джерри» в ближайшем к вам продуктовом магазине? Команда машинного обучения Instacart создала инструменты, чтобы понять это! Масштаб нашего рынка позволяет нам строить сложные модели прогнозирования. Наше сообщество, состоящее из более чем 100 000 покупателей, сканирует миллионы товаров в день в 20 000 физических магазинов и доставляет их покупателям. Эти магазины принадлежат нашим партнерам по..

Визуализация данных и диагностика диабета с использованием логистической регрессии
Сначала поговорим о данных. Данные можно загрузить из базы данных Kaggle , при условии, что у вас есть учетная запись Kaggle. Целью данных является прогнозирование потенциальных случаев диабета на основе определенных диагностических мер. Все опрошенные - женщины не моложе 21 года индейского происхождения пима. Логистическая регрессия (LR) является одной из наиболее важных прогностических моделей в классификации. Проще говоря, логистическую регрессию можно использовать для моделирования..

Прогнозирование работоспособности насосов для водяных скважин в Танзании с использованием случайных лесов
В третьей итерации этого блога Data Science я собираюсь пройти через весь процесс проекта, создав модель машинного обучения с использованием Random Forest, мощного метода ансамблевого моделирования. Я буду работать с данными конкурса на drivendata.org, на котором размещены данные из taarifa, API с открытым исходным кодом и Министерства водных ресурсов Танзании. Я продемонстрирую использование модели классификации случайного леса для выполнения тройной классификации функциональности водяных..