С помощью служб aws athena я пытаюсь импортировать файл csv, включая данные новой строки
При импорте данных используется формат hive serde.
Если данные такие, (все данные заключены в двойные кавычки. "")
«DataA» | «DataB» | «DataC»
«Data1» | «Data2
с новой строкой» | «Data3»
«Data 가» | «Data2 나» | «Data 나»
тогда как записать регулярные выражения в таблицу DDL ниже?
CREATE EXTERNAL TABLE ssdm_schema.ABCTable_regex (
Data_A VARCHAR(100)
, Data_B VARCHAR(100)
, Data_C VARCHAR(100)
) ROW FORMAT SERDE 'org.apache.hadoop.hive.serde2.RegexSerDe'
WITH SERDEPROPERTIES (
"input.regex" = '?????????'
)
Я задаю этот вопрос, имея в виду следующий ответ.
Как обрабатывать в AWS Athena разрывы строк
Спасибо