Чем отличается ч / б Mapr Vs Cloudera?

Cloudera - это бесплатная и корпоративная версия, но MapR - это почти корпоративная версия. Почему? есть ли между ними большая разница?


person Community    schedule 27.01.2019    source источник


Ответы (3)


По сути, Cloudera и MapR - это платформы больших данных. В Cloudera есть три редакции: одна бесплатная, корпоративная до 60 дней и полная корпоративная редакция. В бесплатной версии некоторых услуг нет по сравнению с корпоративной версией. Безопасность по умолчанию отсутствует. http://commandstech.com/mapr-vs-cloudera-vs-hortonworks/ В MapR есть полностью корпоративная версия, потому что у нее есть собственная безопасность и встроенные службы, и в основном используются финансовые области. Высокая доступность также больше по сравнению с Cloudera

person ss sreekanth    schedule 27.01.2019

Cloudera - это, по сути, просто Apache Hadoop, включая Spark и Hive с некоторыми инструментами управления. Это в значительной степени ограничено работой HDFS.

MapR - гораздо более универсальная система. Он поддерживает программное обеспечение Apache, такое как Hadoop, Spark, Hive и Drill, но также выходит далеко за рамки этого. Поддержка Kubernetes отличная (включая очень обычное программное обеспечение, такое как postgres или mySQL), и вы можете свободно смешивать и сочетать обычное программное обеспечение с программным обеспечением для работы с большими данными. Вы также можете использовать программное обеспечение машинного обучения и искусственного интеллекта без необходимости копировать данные в специализированные кластеры.

Кроме того, вы можете запускать различные системы HPC (высокопроизводительные вычисления) непосредственно на MapR без необходимости их преобразования для использования API больших данных.

person Ted Dunning    schedule 04.04.2019

Cloudera работает на HDFS, тогда как MAPR работает на MAPRFS. HDFS только добавляется, тогда как MAPRFS допускает произвольное чтение / запись, что делает его высокоэффективным. Это фактически означает, что MAPR может обеспечить такую ​​же производительность при гораздо меньших требованиях к памяти, чем HDFS. Самая низкая единица чтения / записи в MAPRFS намного меньше. HDFS - это распределенная файловая система, но под ней используется файловая система Linux для записи данных на фактический диск. Это отсутствие контроля над оптимизацией во время фактической записи на необработанный диск, в MapR у них напрямую есть собственный код, который оптимизированным образом записывает непосредственно на диски. Само по себе это единственная большая причина для улучшения записи: поскольку код написан на C, сборка мусора JVM не требуется. Для получения дополнительной информации вы можете найти ссылку: https://mapr.com/blog/database-comparison-an-in-depth-look-at-mapr-db/

person TheCuriousOne    schedule 27.05.2019