Я оценивал Spark Notebook и нашел три разных продукта; 1. Hue 3.9 поставляется с записной книжкой Spark (бета) 2. Apache zeppelin 3. andypetrella / spark-notebook.
Не могли бы вы помочь мне понять плюсы и минусы каждого продукта?
Спасибо, пани
Я оценивал Spark Notebook и нашел три разных продукта; 1. Hue 3.9 поставляется с записной книжкой Spark (бета) 2. Apache zeppelin 3. andypetrella / spark-notebook.
Не могли бы вы помочь мне понять плюсы и минусы каждого продукта?
Спасибо, пани
Я играл только с Hue и Jupyter.
Hue - это что-то новое, но он предлагает больше, чем просто блокнот Spark, он интегрируется со всеми компонентами Hadoop (Oozie, Solr, Impala, HBase, Pig ...).
Jupyter отлично подходит, если вам нужен продвинутый редактор для Pyspark. Редактор Python действительно хорош и очень популярен в сообществе Python.
Jupyter - это хорошо зарекомендовавший себя проект, тогда как Spark Notebook - отличный, но индивидуальный проект с хорошими довольно недавними объяснениями от самого автора, а Zeppelin инкубирует в Apache, поэтому, исходя из этого соображения, у нас есть современная версия" никого никогда не увольняли за покупку IBM "(пока они не сделали ха-ха), а Джупитер - это IBM в комнате.
Может быть полезно просмотреть некоторые документы по Cloudera, например http://blog.cloudera.com/blog/2014/08/how-to-use-ipython-notebook-with-apache-spark/ (обратите внимание на использование Jupyter называться iPython Notebook)
Если бы вы могли опубликовать больше о своем варианте использования, это помогло бы людям ответить на ваш вопрос, и, возможно, опубликовать результаты исследования, которое вы уже провели, StackOverflow предъявляет особые требования к хорошим вопросам, и большое внимание уделяется тому, чтобы сначала что-то попробовать и опубликовать код. Возможно, ваш вопрос больше подходит для другого сайта StackExchange.
Если вы посмотрите здесь, вы получите более интересную информацию, например, Zeppelin больше сосредоточен на работает поверх Hadoop (и Tachyon? который, я полагаю, является прозрачным слоем), а Zeppelin предоставляет подключаемый интерфейс, чтобы вы могли разрабатывать с большим количеством языков.