Мы использовали весеннюю партию для следующих случаев использования
- Чтение данных из файла, обработка и запись в целевую базу данных (пакетная обработка запускается по прибытии файла)
- Чтение данных из удаленной базы данных, обработка и запись в целевую базу данных (выполняется с заданным интервалом, запускается Autosys)
В связи с планом по переносу всех онлайн-приложений на микросервисы с весенней загрузкой и PCF, мы планируем провести аналогичное упражнение на стороне партии, если это повысит ценность.
В новом мире задача весеннего облачного пакетного задания будет считывать файл из хранилища S3 (ECSS3).
Я ищу здесь хороший дизайн (по возможности избегайте слишком большого количества каналов / фильтров и оркестровки), входные данные варьируются от 1 до 20 миллионов записей.
- ECSS3 будет уведомлять о прибытии файла, отправив http-запрос, рабочий процесс будет: clould stram httpsource-> launch clould batch job task, которая будет читать из хранилища объектов, обрабатывать и сохранять записи в целевой базе данных.
- Задание Spring Clould запускается из планировщика PCF для чтения из удаленной базы данных, обработки и сохранения в целевой базе данных
С указанным выше дизайном я не вижу смысла обертывать пакетное задание пружины в задачу clould и запускать в PCF с потоком данных Spring.
Я что-то упустил? Является ли в этом случае PCF / SpringClouldDataFlow излишеством?