Может ли поток данных сопоставления использовать параметризованный набор данных Parquet?

спасибо, что зашли.

Я пытаюсь разработать поток данных сопоставления в рабочем пространстве Azure Synapse (поэтому я считаю, что это также можно применить к ADFv2), который принимает ввод Delta и преобразует его прямо в вывод в формате Parquet, с соответствующими деталями использование набора данных Parquet, указывающего на ADLSGen2 с параметризованной файловой системой и папкой, в отличие от жестко запрограммированной файловой системы и папки, поскольку для этого потребуется создать слишком много наборов данных, поскольку в данных слишком много папок, представляющих интерес. Озеро.

Поток данных сопоставления:

Когда я пытаюсь использовать его в качестве источника в моих потоках данных сопоставления, конфигурация отладки (а также конфигурация родительского конвейера) должным образом запросит у меня ввод этих параметров, которые я с радостью введу.

Затем, как только я пытаюсь отладить или запустить конвейер, я получаю эту ошибку менее чем за 1 секунду:

{
"Message": "ErrorCode=InvalidTemplate, ErrorMessage=The expression 'body('DataFlowDebugExpressionResolver')?.50_DeltaToParquet_xxxxxxxxx?.ParquetCurrent.directory' is not valid: the string character '_' at position '43' is not expected."
}

RunId: xxx-xxxxxx-xxxxxx

Это сообщение об ошибке не очень специфично, чтобы знать, где мне искать.

Я попытался заменить параметризованный набор данных Parquet на жестко запрограммированный, и он отлично работает как в режимах отладки, так и в режиме конвейерного выполнения. Однако это не дает мне того, что мне нужно, а именно возможности повторно использовать мой набор данных Parquet вместо того, чтобы создавать определенный набор данных для каждой папки Data Lake.

В файловой системе Data Lake также нет пробелов. Пожалуйста, обратитесь к этим параметрам, которые очень похожи на мою производственную среду:

Файловая система: prodfs001
Каталог: synapse/workspace01/parquet/dim_mydim

Заранее спасибо всем, ребята!

Jesus21282 21.01.2021 источник

Ответы (1)

arrow_upward
1
arrow_downward

Имя каталога synapse / workspace01 / parquet / dim_mydim имеет _ в dim_mydim, можете ли вы попробовать заменить подчеркивание или, может быть, вы можете использовать dimmydim, чтобы проверить, работает ли он.

Pratik Somaiya 26.01.2021

Может ли поток данных сопоставления использовать параметризованный набор данных Parquet?

Ответы (1)

Вопросы по теме