Публикации по теме 'data-lake'
Основные требования для реализации озера данных в Azure
В эпоху принятия решений на основе данных организации обращаются к современным архитектурам данных, чтобы раскрыть ценность своих данных. Одной из таких архитектур является озеро данных, которое обеспечивает масштабируемое и гибкое решение для хранения и анализа огромных объемов структурированных и неструктурированных данных. Azure, облачная платформа Microsoft, предлагает надежный набор сервисов и инструментов для реализации озера данных. Однако, прежде чем углубляться в реализацию,..
Как мы развертываем наши модели машинного обучения в Depop
Обзор
В этом сообщении в блоге мы хотим рассказать вам, как нам удалось улучшить методы производства алгоритмов и моделей машинного обучения. Но прежде чем мы углубимся в детали, давайте начнем с небольшого рассказа. Все любят истории, правда ?!
Вы определили возможность, в которой машинное обучение действительно может помочь вашему бизнесу. Вы успешно собрали команду машинного обучения. Команда создает несколько прототипов, и после нескольких итераций ваша первая модель, наконец,..
Microsoft Azure против Google Cloud Platform: каковы основные недостатки Google Cloud…
И Microsoft Azure, и Google Cloud Platform (GCP) являются основными службами облачных вычислений, которые предлагают широкий спектр инструментов машинного обучения. Однако обе службы не созданы одинаково. Они не поддерживают модели машинного обучения одного типа; они не предлагают одинаковый набор инструментов для обработки данных; и они не поддерживают такой же пользовательский интерфейс или дизайн.
Когда дело доходит до сервисов облачных вычислений, GCP обычно считается лучшим выбором..
Как принимать и использовать данные из Azure Data Lake
Анализ моделей приема/потребления, включая PoC в дельте озера
1. Введение
Многие компании рассматривают возможность создания Enterprise Data Lake. Идея состоит в том, чтобы хранить данные в централизованном хранилище. Основными заинтересованными сторонами озера данных являются следующие две организации:
Производитель данных . Объект, который загружает данные в озеро данных. Как правило, это организация, которая не извлекает выгоду из озера данных напрямую и предпочитает простой..
Современная инженерия данных: создание хранилища данных с помощью Apache Spark — Том 1.
Приветствуем всех на борту рейса l’Oasis, бортпроводники, пожалуйста, подготовьте наших специалистов по данным, пока они пристегивают ремни безопасности, к путешествию навстречу смене парадигмы в Data Engineering.
Предпосылка
Добро пожаловать в первый том этой серии из двух частей. В этой первой части мы познакомим вас с новым подходом к инженерии данных, включающим эволюцию традиционных методов Enterprise Data Warehouse и Data Lake в новую парадигму Data Lakehouse ,..
Раскрытие потенциала машинного обучения в озере данных
Поскольку данные становятся пищей для мозгов каждой организации, независимо от ее размера или отрасли, крайне важно использовать эти данные для достижения наилучших результатов, принятия наиболее обоснованных решений и повышения производительности. Однако с каждым действием, реакцией и взаимодействием создается новая порция данных, что приводит к лавине информации.
Управление лавиной
Ключевым моментом становится хранение и управление всеми интересующими данными — как..
Архитектура бизнес-аналитики
Вызов
Одной из самых больших проблем для бизнеса является наличие множества бизнес-систем, таких как SAP, Sales Force, бизнес-системы Oracle и многое другое. Наиболее распространенными являются SAP и отдел продаж, но идея здесь заключается в создании озера данных, независимого от любых бизнес-систем, поскольку оно обеспечивает большую ценность для бизнеса, поскольку их аналитика не связана с продуктом.
Также предоставьте масштабируемые и основанные на стоимости системы. Другая проблема..