Streamsets Transformer — источник JDBC без столбца смещения

Я тестирую платформы, которые позволяют любому пользователю легко создавать конвейеры обработки данных. Эта платформа должна соответствовать определенным требованиям, и одно из них — способность перемещать данные из Oracle/SQL Server в HDFS.

Streamsets Transformer (v3.11) соответствует всем требованиям, включая указанное выше. Я просто не могу заставить его работать в очень конкретном случае: при приеме таблицы, которая не содержит числовых столбцов.

В этих случаях я хочу, чтобы конвейер обрабатывал все данные, поэтому в источнике JDBC я включил свойство «Пропустить отслеживание смещения». Я думал, что, пропустив отслеживание смещения, не нужно будет устанавливать свойство «Смещение столбца» (думаю, я ошибался).

введите здесь описание изображения

JDBC_05 - Table doesn't have compatible primary key configuration - supporting exactly one column but table have 0

Если числовой столбец существует, возможным обходным путем является установка его в качестве столбца смещения, но я не могу найти способ сделать это, когда его не существует.

Я что-то упускаю?

Спасибо


person André Machado    schedule 17.12.2019    source источник
comment
Сам Spark не может эффективно справиться с этой ситуацией. Если нет числового столбца, он не может разбивать данные, и, следовательно, лучшее, что он может сделать, — это один гигантский раздел со всеми строками. Этого вы ожидаете от Transformer?   -  person Jeff Evans    schedule 17.12.2019
comment
@JeffEvans Да, это так. Это очень частный случай требований для работы с некоторыми небольшими таблицами.   -  person André Machado    schedule 17.12.2019


Ответы (1)


Мы рассматриваем возможность реализации этой функции в Transformer в будущем выпуске. Я вернусь и обновлю этот ответ любыми новостями.

А пока вы можете рассмотреть возможность использования сборщика данных StreamSets для этих таблиц. У него нет требования «числовой столбец смещения».

person metadaddy    schedule 17.12.2019