Я пытаюсь создать службу отчетов в реальном времени на базе Microsoft Azure Data Warehouse. В настоящее время у меня есть SQL-сервер с примерно 5 ТБ данных. Я хочу передавать данные в хранилище данных и использовать вычислительную мощность Azure DW для создания отчетов в реальном времени на основе данных. Есть ли какие-нибудь готовые к использованию / лучшие практики для этого?
Один из подходов, который я рассматривал, - это загрузка данных в Kafka, а затем их потоковая передача в Azure DW с помощью потоковой передачи Spark. Однако этот подход более близок к реальному времени, чем к реальному времени. Есть ли способ использовать систему отслеживания измененных данных SQL Server для потоковой передачи данных в хранилище данных?