Я узнал (из курса Adrian Cantril / LA 2019 SA Pro), что Redshift Spectrum будет использовать собственный кластер Redshift для обеспечения более стабильной производительности, чем это доступно за счет использования общей емкости, которую AWS предоставляет для запросов Athena. Я понимаю, что эта информация может быть полезна только для экзамена, я не нашел его аргументы убедительными.
Я написал этот ответ, потому что меня не устраивало, что в главном ответе Афина превосходит Redshift Spectrum. Остальная часть этого ответа хороша, и я не хочу напрямую копировать что-либо из этого здесь (без ссылок, которые не были зарегистрированы у меня, когда я писал это).
Я (опять же, основываясь исключительно на моих независимых исследованиях) выбрал бы Spectrum, когда большая часть моих данных находится в S3, что обычно будет для больших наборов данных. Однако недавние экземпляры RA3, похоже, перекрывают эту нишу. Итак, я считаю, что Spectrum лучше всего подходит для тех случаев, когда у нас есть долгосрочные кластеры Redshift, которые, будучи узлами OLAP, имеют резервную емкость для запроса S3.
Зачем вам использовать собственное поместье для выполнения запросов, которые Афина могла бы выполнить без таких вложений с вашей стороны? Кеширование там, где оно подходит. И стабильная игра, если верить Адриану Кантриллу больше, чем Джону Скотту. Это заставило меня подозревать, что RA3 может вытеснить Spectrum; это и отсутствие достойной литературы по Спектруму. Почему Amazon предлагает бессерверный продукт в Афине, который превосходит Redshift Spectrum, более дорогой? Вот как они решили отказаться от RRS. Я не могу поверить, что Spectrum устарел, поэтому должен предложить этот ответ, чтобы оспорить это. Просто посмотрите на https://aws.amazon.com/redshift/whats-new/ а>.
Думаю, изображение ниже (из https://d1.awsstatic.com/events/Summit/AMER2020/May13SummitOnline/Modernize_your_data_warehouse.pdf) совершенно ясно, что вычислительные узлы здесь имеют большое значение, и, возможно, вопреки ценной информации @ JonScott выше.
Еще одно большое отличие заключается в том, что Athena ограничена IAM для аутентификации, как показано на слайде Revent 2018 (ANT201-R1):
person
John
schedule
06.01.2021