Как загрузить данные из kafka в hdfs с помощью пакетного задания spring-xd? Я хотел бы иметь пакетное задание, которое планируется запускать один раз в день. Как я могу отслеживать смещения в kafka?
Пакетное задание Spring-xd для приема данных из kafka в hdfs
Ответы (1)
Я предполагаю, что настройка потока kafka | hdfs
не поможет вам, поскольку вы хотите запустить это как пакетное задание, чтобы вы могли организовать его как пакетное задание.
В этом случае готовый модуль пакетного задания XD, который может запускать kafka -> hdfs, пока недоступен. Вы можете реализовать пользовательский модуль пакетного задания.
Чтобы читать сообщения Kafka, вам понадобится реализация ItemReader
, которая читает сообщения Kafka от Kafka Broker. См. аналогичный подход в AMQPItemReader:
Взгляд на spring-integration-kafka поможет здесь для конкретной реализации Kafka: https://github.com/spring-projects/spring-integration-kafka
Для записи данных в HDFS в XD уже есть org.springframework.xd.batch.item.hadoop.HdfsTextItemWriter
.
Любой из существующих модулей пакетных заданий XD, которые записывают в HDFS, поможет вам реализовать это. Не стесняйтесь открывать JIRA, и ваш вклад приветствуется.