Публикации по теме 'data-engineering'


Машинное обучение с помощью машинного обучения Azure
Общий концептуальный обзор среды реализации ML DevOps Pipeline Введение Служба машинного обучения Azure (AML) предлагает комплексные возможности для управления жизненным циклом машинного обучения. Ключевыми характеристиками являются MLOps (операции машинного обучения), функциональная совместимость, интеграция с инструментами и платформами машинного обучения, безопасность и доверие, а также расширяемость и производительность. Azure Machine Learning SDK в Python или PowerShell..

Что следует знать перед использованием Amazon Elasticsearch Service на AWS
Elasticsearch - это мощная, но хрупкая часть инфраструктуры с множеством вещей, которые могут привести к нестабильности сервиса AWS. Я пишу это после особенно разочаровывающего дня, когда жду сообщений об отсутствии сообщений от службы поддержки AWS. Наш кластер Elasticsearch не работал большую часть дня, и мы все время занимались поддержкой AWS. На моей предыдущей работе в Loggly мы с моей командой поддерживали массовое развертывание Elasticsearch с несколькими кластерами. Я..

Как извлечь последние данные о землетрясениях с правительственного веб-сайта
Учебное пособие по сбору данных о землетрясениях с правительственных веб-сайтов. Концепция парсинга выглядит простой, но мощной. Существуют миллионы и даже миллиарды веб-сайтов, в которых есть ценные данные, которые вы, возможно, захотите получить. Вы можете просто скопировать данные с веб-сайта и вставить их в текстовый редактор, Excel или любой другой инструмент. Но, конечно, это долго и неэффективно. Вот почему нам нужен язык программирования для автоматического выполнения..

13 лучших конференций по науке о данных, которые вы должны посетить в 2023 году
Введение Посещение конференций по науке о данных может быть захватывающим способом быть в курсе последних событий в этой области, учиться у экспертов и общаться с другими профессионалами. Но с таким количеством конференций может быть сложно решить, какие из них посетить.

Потоковое машинное обучение с помощью Kafka, Debezium и BentoML
Создание системы рекомендаций по ценам в режиме реального времени с использованием современных инструментов, связанных с данными Введение Недавно GitHub анонсировал ожидаемый (и спорный) Copilot, искусственный интеллект, способный генерировать и предлагать фрагменты кода со значительно хорошей производительностью. Тем не менее, Copilot впечатляет не только своими возможностями внушения — что-то уже достигнутое в научных работах — но главным образом тем, что это отличный продукт (и..

Варианты разработки программного обеспечения для машинного обучения
Контрольный список решений по архитектуре программного обеспечения Контрольный список из пяти частей, помогающий разработать программное обеспечение, которое помогает сделать правильный выбор программного ядра при реализации службы прогнозирования. Облако против края Вычислительные ресурсы облака позволяют более точно распознавать речь. Работа на краю резервного копирования на случай, если остальная часть Интернета выйдет из строя Современные веб-браузеры часто имеют инструменты..

Обучение Data Engineering в 2023 году
Обучение Data Engineering в 2023 году Базовый список тем и рекомендуемых ресурсов в 2023 году В современном мире, управляемом данными, инженерия данных стала важной областью, которая играет ключевую роль в извлечении полезных идей из обширных данных. Поскольку предприятия и организации стремятся использовать данные для принятия обоснованных решений, спрос на квалифицированных инженеров данных резко возрос. Если вы заинтересованы в том, чтобы начать карьеру в области инженерии данных..