Я написал собственный источник Streamsets. Некоторые записи содержат такие символы, как é или ë. При запуске моих автоматических тестов я могу проверить, что данные отправляются в виде списка записей SDC, как и предполагалось.
Однако, когда я использую свой пользовательский источник в конвейере на докеризованном сборщике данных Streamsets, все эти специальные символы отображаются в пользовательском интерфейсе (предварительный просмотр) и помещаются в мою цель как '?'.
Интерпретирует ли Streamsets вывод моего источника и применяет ли кодировку символов?