Публикации по теме 'dask'


Распределенная линейная регрессия с помощью cuML
Как масштабировать машинное обучение на GPU с помощью Dask (с кодом + данными) В Руководстве для начинающих по линейной регрессии с cuML мы рассмотрели, что такое линейная регрессия и cuML, и как реализовать модель линейной регрессии cuML для прогнозирования PRICE дома. Давайте масштабируем эти принципы, позволив cuML использовать несколько графических процессоров через Dask, и построим распределенную модель LinearRegression, которая прогнозирует fare_amount поездки на такси в..

Dask и RAPIDS: следующие важные достижения в области науки о данных и машинного обучения в Capital One
Автор: Райан МакЭнти, старший директор по разработке программного обеспечения, и Майк Маккарти, директор по разработке программного обеспечения Создание сцены За последние 3 с лишним года у меня была возможность возглавить инженерные разработки Capital One по модернизации наших корпоративных платформ Data Science, Quantitative Analyst и Data Analyst. Наша основная цель заключалась в том, чтобы перенести корпоративных пользователей данных с локальной платформы, в основном на..

Оптимизированные способы чтения больших CSV в Python
Привет! 🙋 В настоящее время данные играют очень важную роль в анализе и построении модели машинного обучения и искусственного интеллекта. Данные можно найти в различных форматах CSV, плоских файлов, JSON и т. Д., Что, когда они огромны, затрудняет чтение в память. Этот блог посвящен обработке табличных данных в формате CSV, которые представляют собой файлы, разделенные запятыми. Проблема: импорт (чтение) большого CSV-файла приводит к ошибке "Недостаточно памяти". Недостаточно..

Построение линейных моделей с помощью Dask ML
СТАТЬЯ Построение линейных моделей с помощью Dask ML Из статьи Джесси С. Дэниела Наука о данных в масштабе с помощью Python и Dask ___________________________________________________________________ Получите Науку о данных в масштабе с Python и Dask со скидкой 37 % от обычной цены, введя код fccdaniel в поле для кода скидки при оформлении заказа на manning.com . ________________________________________________________________________________ В этой статье рассматривается..

Пусть машина настроится сама — DIY AutoML с использованием Dask и BayesianOpt
Разработка Proof of Concept всегда была важной частью карьеры Data Science. Когда мы разрабатываем модели машинного обучения для прогнозирования в потоке решений, мы обычно тестируем множество разных моделей для одной и той же цели прогнозирования. В процессе большая часть времени будет потрачена на тестирование каждой модели и настройку каждой модели, чтобы получить максимальную отдачу от алгоритм. Наконец, мы сравниваем каждый из полученных лучших результатов, чтобы выбрать..

Распределенная предварительная обработка текста с помощью Python и Dask
Распределенное машинное обучение с Python и Dask Распределенная предварительная обработка текста с помощью Python и Dask Подход к масштабированию задач обработки данных Если вы собрали автономный кластер и имеете достаточно знаний о том, как работает Dask в фоновом режиме , пришло время для некоторой практической науки о данных . Кстати, весь мой исходный код и данные вы можете найти в моем аккаунте GitHub . Что мы пытаемся предсказать? Я хочу разделить обзоры..

Масштабируемое машинное обучение с помощью Dask в Google Cloud
Отличное дополнение к вашему арсеналу инструментов для анализа данных, Dask обеспечивает расширенный параллелизм для масштабных вычислений. Обновлено 13 ноября 2021 г. и отражает последние шаги по настройке кластера Dask в Google Cloud Dask был рассмотрен многими и сравнивался с различными другими инструментами, включая Spark, Ray и Vaex. Разработанный в сотрудничестве с другими проектами сообщества, такими как Numpy, Pandas и Scikit-Learn, это определенно отличный инструмент для..