CDH4 - Смешайте 64-битную и 32-битную машину

У меня есть небольшой кластер с 6 64-битными машинами с установленным cloudera manager (CM), который отлично работает. Я хочу добавить в этот кластер набор 32-битных машин в качестве узла данных. Согласно документу CM невозможно установить 32-битные машины с менеджером. С другой стороны, я могу установить CDH4 вручную на эти 32-битные машины. Могу ли я соединить все машины вместе?


person lizzie    schedule 08.04.2014    source источник


Ответы (1)


Да, можно подключить 32- и 64-битные машины к одному кластеру, даже если на 64-битной машине был установлен менеджер cloudera.

Итак, в основном вам нужно загрузить и установить пакет cloudera для 32-битной машины на каждом 32-битном хосте: sudo yum --nogpgcheck -y localinstall cloudera-cdh-4-0.i386.rpm

Затем установите hadoop-hdfs-datanode: sudo yum -y install hadoop-hdfs-datanode

Если вы хотите назначить каталог / my-hdfs-dir для hdfs, убедитесь, что hdfs является владельцем этого каталога (для каждого 32-битного хоста): chown -R hdfs /my-hdfs-dir

Вам нужно добавить 32-битный хост в список разрешенных хостов: dfs_hosts_allow.txt. В моем случае этот файл находится в /var/run/cloudera-scm-agent/process/847-hdfs-NAMENODE. Обычно, если вы перейдете к /var/run/cloudera-scm-agent/process/, вы найдете список процессов, вам нужно изменить самый последний процесс NAMENODE. Чтобы принять во внимание новые узлы, обновите узлы: sudo -u hdfs hdfs dfsadmin -refreshNodes

Вам также необходимо настроить каждый 32-битный хост. Самый простой - скопировать файлы core-site.xml и hdfs-site.xml с одного существующего 64-битного ведомого устройства. Вы найдете эти файлы в /var/run/cloudera-scm-agent/process/xxx-hdfs-DATANODE на ведомом устройстве. Вы можете прокомментировать все свойства, содержащие название мази, из которой вы копируете файлы (в этом нет необходимости). После изменения файла скопируйте его на все 32-битные хосты в /etc/hadoop/conf.

Теперь вы можете запускать hdfs на 32-битных хостах: sudo service hadoop-hdfs-datanode start

Вы можете проверить, установлен ли новый узел данных, просмотрев master_ip:50070. К сожалению, я не думаю, что есть возможность увидеть эти новые машины в веб-интерфейсе cloudera manager. Если кто-то знает решение, это очень приветствуется.

person lizzie    schedule 10.04.2014