Может ли кто-нибудь объяснить разницу между интеллектуальным доступом к данным в SAP HANA и SAP HANA Vora?
Как я понимаю, SDA просто создает некоторые virtual tables
, которые позволяют получить доступ к данным внешней системы (например, Hadoop и многим другим базам данных с помощью ODBC), как если бы они были частью системы SAP HANA (так что вы может использовать HANA IDE) и использует «ядро базы данных по умолчанию» для вычисления и возврата промежуточного результата этой внешней системы обратно в SAP HANA.
Концепция Vora также заключается в предоставлении пользователю SAP доступа к системе Hadoop, но промежуточные результаты рассчитываются с использованием механизма выполнения InMemory Apache Spark.
Я читал, что Hadoop - идеальное хранилище данных для холодных данных (данные, поступающие из SAP HANA, которые старше определенного периода времени и не нужны для всех анализов). Но меня смущают эти два решения для доступа к данным, так как я не могу найти важной разницы.
Что было бы лучше, если вы планируете получать доступ к горячим (SAP HANA) и холодным (Hadoop) данным за один анализ, написанный инструментами SAP HANA?
Что вы порекомендуете объединить SAP HANA и кластер Hadoop, содержащий данные в таблицах Hive?