Поскольку QuickSight может напрямую запрашивать S3, когда нам нужно использовать Athena в качестве источника данных для QuickSight?

Может быть, мне чего-то не хватает, но я не могу понять, какую выгоду я получу, если подключу Athena с QuickSight вместо подключения QuickSight напрямую к S3. Пожалуйста, помогите мне понять это.


person Anand Shaw    schedule 17.11.2017    source источник


Ответы (1)


Amazon S3 - это объектное хранилище, предназначенное для хранения и извлечения любого объема данных. Обычно он содержит необработанные или неструктурированные данные (в определенном формате файла .csv или .tsv).

Amazon Athena использует управляемый каталог данных для хранения информации и схем о базах данных и таблицах, которые вы создаете для своих данных, хранящихся в Amazon S3. Итак, Афина знает о данных и их структуре (т.е. некоторой схеме) в S3.

Кроме того, QuickSight может напрямую подключаться к базе данных Athena и запрашивать данные для анализа. Когда вы подключаетесь к базе данных Athena, вы, скорее всего, будете обрабатывать структурированные или полуструктурированные данные.

Файлы манифеста Amazon S3 не требуются, если источником данных является Amazon Athena.

Некоторые ограничения при прямом подключении к S3: -

Размер файла, указанного в манифесте, не может превышать 1 ГБ, общий размер всех указанных файлов не может превышать 10 ГБ, а общее количество указанных файлов не может превышать 1000.

Вышеуказанные ограничения недоступны при создании набора данных с использованием данных Amazon Athena.

Еще одна функция при создании набора данных с использованием данных Amazon Athena: -

Вы можете напрямую анализировать данные без загрузки или загрузки в SPICE и анализировать данные.

Вывод: -

Если вы ничего не сделали со своими файлами S3, вы можете просто использовать QuickSight, используя S3 в качестве набора данных.

В случае, если вы загрузили данные S3 в Athena, вы можете использовать Athena в качестве набора данных для QuickSight.

Используя Athena или любой другой источник данных, вы получите несколько преимуществ и сможете преодолеть некоторые ограничения (например, размер файла), упомянутые выше.

person notionquest    schedule 17.11.2017
comment
супер. Огромное спасибо :) - person Anand Shaw; 18.11.2017
comment
Не могли бы вы объяснить, загрузили ли вы данные S3 в Athena, тогда вы можете использовать Athena в качестве набора данных для QuickSight. Насколько я понимаю, результаты запроса, запущенного с использованием Athena, сохраняются в корзине S3 (пример результатов имя корзины S3: results). Это означает, что вы не можете ничего загрузить в Афину. Когда Athena задана как набор данных для QuickSight, тогда QuickSight вызывает athena, в результате чего запрос запускается в source S3 bucket, а результаты сохраняются в results S3 bucket. Затем QuickSight отображает диаграммы / результаты на основе значений в results S3 bucket. - person variable; 19.11.2020
comment
Действуют ли эти ограничения S3 (1 ГБ на файл, всего 10 ГБ)? Не видите их здесь: docs.aws.amazon .com / quicksight / latest / user / - person chaooder; 15.12.2020