Оценка Spark-Notebook

Я оценивал Spark Notebook и нашел три разных продукта; 1. Hue 3.9 поставляется с записной книжкой Spark (бета) 2. Apache zeppelin 3. andypetrella / spark-notebook.

Не могли бы вы помочь мне понять плюсы и минусы каждого продукта?

Спасибо, пани


person Pani Dhakshnamurthy    schedule 23.09.2015    source источник
comment
Почему бы вам не попробовать загрузить каждую из них или сравнить их списки функций и несколько снимков экрана, чтобы увидеть, какая из них вам подходит?   -  person Matt    schedule 23.09.2015
comment
Привет, Мэтт, я пытаюсь ... тем временем я думал о том, чтобы получить опыт других, прежде чем принять решение.   -  person Pani Dhakshnamurthy    schedule 23.09.2015
comment
Вы также можете попробовать jupyter, он поддерживает Spark! Попробовать   -  person Alberto Bonsanto    schedule 24.09.2015


Ответы (2)


Я играл только с Hue и Jupyter.

Hue - это что-то новое, но он предлагает больше, чем просто блокнот Spark, он интегрируется со всеми компонентами Hadoop (Oozie, Solr, Impala, HBase, Pig ...).

Jupyter отлично подходит, если вам нужен продвинутый редактор для Pyspark. Редактор Python действительно хорош и очень популярен в сообществе Python.

person user2575101    schedule 29.09.2015

Jupyter - это хорошо зарекомендовавший себя проект, тогда как Spark Notebook - отличный, но индивидуальный проект с хорошими довольно недавними объяснениями от самого автора, а Zeppelin инкубирует в Apache, поэтому, исходя из этого соображения, у нас есть современная версия" никого никогда не увольняли за покупку IBM "(пока они не сделали ха-ха), а Джупитер - это IBM в комнате.

Может быть полезно просмотреть некоторые документы по Cloudera, например http://blog.cloudera.com/blog/2014/08/how-to-use-ipython-notebook-with-apache-spark/ (обратите внимание на использование Jupyter называться iPython Notebook)

Если бы вы могли опубликовать больше о своем варианте использования, это помогло бы людям ответить на ваш вопрос, и, возможно, опубликовать результаты исследования, которое вы уже провели, StackOverflow предъявляет особые требования к хорошим вопросам, и большое внимание уделяется тому, чтобы сначала что-то попробовать и опубликовать код. Возможно, ваш вопрос больше подходит для другого сайта StackExchange.

Если вы посмотрите здесь, вы получите более интересную информацию, например, Zeppelin больше сосредоточен на работает поверх Hadoop (и Tachyon? который, я полагаю, является прозрачным слоем), а Zeppelin предоставляет подключаемый интерфейс, чтобы вы могли разрабатывать с большим количеством языков.

person JimLohse    schedule 18.01.2016