Вам необходимо использовать сторонний инструмент, который анализирует весь ваш файл данных S3, чтобы построить схему SQL из набора данных в файле. Или, может быть, инструменту предоставлен доступ к определению источника данных (чего нет у Snowflake), чтобы упростить работу с инструментом.
Вы можете найти фрагменты кода хранимой процедуры Snowflake, выполнив поиск здесь в stackoverflow, который выводит определения схемы, например. рекурсивное сглаживание файлов данных JSON.
Если вы хотите, чтобы импорт был гибким, вам необходимо использовать гибкий формат данных, такой как JSON, и гибкий тип данных SQL, например VARIANT
. Это будет работать, даже если ваши структуры данных изменятся.
Если вы хотите использовать жесткие форматы, такие как CSV или жесткие типы данных SQL (большинство из них жесткие), тогда все усложняется. Жесткие данные не являются гибкими, и, например, файлы CSV не содержат какой-либо встроенной информации о типе, что создает огромные предположения, не соответствующие требованиям будущего.
И, возможно, вы удовлетворены тем, что все ваши столбцы заканчиваются как _2 _...
person
Hans Henrik Eriksen
schedule
01.02.2020