Мне нужен совет о том, что лучше всего подходит для оркестровки процессов. Чтобы дать некоторый контекст, у меня есть следующие задачи, которые нужно организовать:
- Увеличьте масштабирование пула пакетной службы Azure для предоставления необходимых узлов.
- Выполнить собственный код .Net, который вызывает сервер для получения списка задач. Эти задачи меняются ежедневно. Поместите эти задачи в очередь в пакетном пуле.
- Выполните каждую задачу (настраиваемый код .Net) в пуле пакетов. Каждая задача создает данные в учетной записи хранения Azure.
- Уменьшите пакетный пул, поскольку он больше не требуется.
- Запуск / масштабирование хранилища данных
- Массовый импорт данных в хранилище данных (предполагается, что будет использоваться комбинация PolyBase и BCP).
- Агрегируйте данные и создавайте выходные данные в учетной записи хранения Azure.
- Приостановить / уменьшить масштаб хранилища данных
В настоящее время я сравниваю хранилище данных с модулями Runbook, чтобы выполнить вышеуказанное.
Я считаю, что модули Runbook очень примитивны с точки зрения их визуализации во время разработки и выполнения.
Я считаю, что хранилище данных визуально намного удобнее. Однако нарезка данных кажется огромным излишеством. Я просто хочу, чтобы процесс выполнялся, скажем, в 8 утра каждое утро. Я не хочу, чтобы его пытались вывести за прошедшие дни (например, если я внесу поправки в шаблон). Я ожидаю, что хранилище данных также будет лучше справляться с сбоями / возобновлением работы на протяжении всей цепочки действий.
Есть ли какие-то другие подходы, которые я должен рассмотреть здесь / рекомендации?
Спасибо Дэвид