Недавно я пытался получить события чтения Spark из Kinesis, но у меня проблемы с получением событий. Хотя Spark может подключаться к Kinesis и получать метаданные от Kinesis, он не может получать от него события. Он всегда возвращает нулевые элементы.
Ошибок нет, просто возвращаются пустые результаты. Spark может получать метаданные (например, количество шардов в кинезисе и т. Д.).
Я использовал эти [1 и 2] руководства, чтобы заставить его работать, но пока мне не повезло. Я также попробовал несколько предложений от SO [3]. В кластере достаточно ресурсов / ядер.
Мы видели конфликт версий в Protobuf Version между Spark и Kinesis, который также может быть причиной такого поведения. Spark использует protobuf-java версии 2.5.0, а kinesis, вероятно, использует protobuf-java-2.6.1.jar.
Просто интересно, сталкивался ли кто-нибудь с таким поведением или есть искра, работающая с кинезисом.
Пробовали с Spark 1.5.0, Spark 1.6.0.