Публикации по теме 'scikit-learn'


Создавайте пользовательские наборы данных за считанные секунды
Создайте идеальный набор данных, чтобы протестировать свою модель за считанные секунды Новичку может быть немного сложно начать работать с уже существующим набором данных. Или, может быть, вы хотите быстро протестировать модель или попрактиковаться в построении модели на основе последнего изученного вами алгоритма. Но вы не хотите тратить свое время на очистку данных и прочее. Эта статья поможет вам создать свой собственный набор данных в мгновение ока, и вы сможете начать..

Раскройте потенциал конвейеров Scikit-learn
Промежуточное руководство по пайплайнам scikit-learn В своем последнем посте я написал введение в пайплайны scikit-learn. Если вы еще не читали его, вы можете получить доступ по ссылке ниже: Введение в конвейеры Scikit-learn Построение сквозного конвейера машинного обучения с использованием scikit-learn towardsdatascience.com В этой статье я хочу расширить предыдущий пост, показав некоторые интересные функции для создания более..

Аналитика данных розничной торговли
Портфельный проект Data Science с использованием AWS Введение В этой статье я хочу представить вам полное портфолио проекта по науке о данных. В этом проекте я хочу выполнить аналитику розничных данных с использованием веб-службы Amazon и различных алгоритмов машинного обучения. Полный код, включая предложение проекта и окончательный отчет по проекту, можно найти в моем репозитории Github . Определение Аналитика данных розничной торговли (RDA) в настоящее время используется в..

Apple Core ML
На сцену машинного обучения выходит новый игрок, работающий на платформе Apple, Core ML. Core ML имеет ключевое преимущество: он обеспечивает конфиденциальность пользовательских данных и гарантирует, что приложения будут оставаться функциональными и отзывчивыми, когда сетевое подключение недоступно. Core ML Frameworks можно использовать для: Анализ изображения с помощью Vision Обработка естественного языка с помощью Foundation (например, NSLinguisticTagger) Оценка изученных..

Мультиклассовая классификация текста с помощью Scikit-Learn
В коммерческом мире существует множество применений классификации текста. Например, новости обычно сгруппированы по темам; контент или продукты часто помечаются по категориям; пользователей можно разделить на группы в зависимости от того, как они говорят о продукте или бренде в Интернете ... Однако подавляющее большинство статей и руководств по классификации текста в Интернете представляют собой двоичную классификацию текста, такую ​​как фильтрация спама в электронной почте (спам..

Машинное обучение невозможно: обучите модель 1 миллиарда образцов за 5 минут с помощью vaex и scikit-learn на вашем ...
Машинное обучение невозможно: обучите 1 миллиард образцов за 5 минут на своем ноутбуке с помощью Vaex и Scikit-Learn Сделайте свой ноутбук похожим на суперкомпьютер. «Данные - это новая нефть». Независимо от того, согласны ли вы с этим утверждением, гонка за сбор и использование данных продолжается уже некоторое время. Фактически, сегодня технических гигантов объединяет их способность полностью использовать огромное количество данных, которые они собирают. У них есть знания,..

Математика деревьев решений, случайный лес и важность функций в Scikit-learn и Spark
Введение В этом посте делается попытка консолидировать информацию об алгоритмах дерева и их реализациях в Scikit-learn и Spark. В частности, он был написан для разъяснения того, как рассчитывается важность функции. В Интернете есть много замечательных ресурсов, в которых обсуждается, как создаются деревья решений и случайные леса, и этот пост не предназначен для этого. Хотя он включает короткие определения контекста, предполагается, что читатель понимает эти концепции и желает..