Специальные символы (акцент, апостроф, трем) работают в настраиваемых исходных тестах, но больше не работают при развертывании в докеризованных наборах потоков.

Я написал собственный источник Streamsets. Некоторые записи содержат такие символы, как é или ë. При запуске моих автоматических тестов я могу проверить, что данные отправляются в виде списка записей SDC, как и предполагалось.

Однако, когда я использую свой пользовательский источник в конвейере на докеризованном сборщике данных Streamsets, все эти специальные символы отображаются в пользовательском интерфейсе (предварительный просмотр) и помещаются в мою цель как '?'.

Интерпретирует ли Streamsets вывод моего источника и применяет ли кодировку символов?


person nielsn    schedule 22.01.2019    source источник


Ответы (1)


Проблема заключалась вовсе не в настраиваемом источнике или наборах потоков, а в самом контейнере Docker. Официальный контейнер Streamsets, от которого я унаследовал, основан на Alpine Linux. По умолчанию поддержка языковых стандартов не устанавливается, так что хитрость заключается в том, чтобы добавить ее самостоятельно.

Этот пост помог мне установить его в моем контейнере и настроить контейнер. Дальше все заработало как положено.

person nielsn    schedule 23.01.2019