Я пытаюсь импортировать фрагмент HTML, который является частью одного из столбцов в CSV. В фрагменте HTML есть двойные кавычки, и он экранирован. этот CSV создается с использованием Apache Spark.
для иллюстрации проблемы я только что создал 2 столбца с минимальным количеством данных.
CREATE TABLE logs.processing ( ts String,text String) ENGINE = Log
cat sample.csv // Content of the file
"Fri, 01 May 2020 06:47:05 UTC","<html id=\"html-div\">"
Команда импорта выдается после того, как генерируется исключение.
cat sample.csv | clickhouse-client --query="INSERT INTO logs.processing FORMAT CSV"
Исключение
Code: 117. DB::Exception: Expected end of line
если я изменю содержимое sample.csv на
"Fri, 01 May 2020 06:47:05 UTC","col2"
Работает нормально.
Не могли бы вы помочь мне в этом вопросе.
Спасибо.