Настройка Mesos с Ansible в Ubuntu 14.04 в Digital Ocean

Я следил за этим руководством Как настроить готовый к работе кластер Mesos, и по ходу дела мы создавали доступный playbook, который вы можете увидеть здесь учебник по мезо-версии

Ansible работает успешно, и я могу зайти на свой порт 5050 на мастере и увидеть панель управления mesos. Однако, похоже, есть 3 проблемы, которые, надеюсь, все связаны, но кажутся отдельными на первый взгляд.

  1. Рабы не зарегистрированы
  2. Панель управления Marathon не работает, когда я посещаю порт 8080 ни на одном из мастеров.
  3. Первая проблема «в настоящее время нет ведущих» обычно возникает из-за проблемы с zookeeper.

Есть ли идеи о том, что я сделал не так или изменилось ли что-нибудь с момента публикации этого урока?

Edit: попытался покопаться глубже. После запуска ansible я вошел в каждый узел и вручную перезапустил сервисы mesos и marathon. Похоже, это сработало, когда я добрался до приборной панели марафона, а затем, немного повозившись с рабами, я смог увидеть те, которые также были активированы. К сожалению, мне не удалось воспроизвести после ядерной бомбардировки узлов и восстановления. Мои настройки соответствуют руководству, которое я связал, и руководству, на которое ссылается Селин, поэтому я думаю, что это порядок, в котором я выполняю перезапуск службы. Все еще ищу помощь

Edit2: копия журналов от одного из мастеров при запуске последний HTTP-вызов просто повторяется и повторяется

Спасибо

В верхней части панели инструментов mesos говорится, что в настоящее время мастера не возглавляют


person Mark    schedule 30.09.2015    source источник


Ответы (2)


Убедитесь, что на вашем сервере запущен zookeeper. Это также объяснило бы вашу проблему с Marathon и мезо-рабами.

Эта документация кажется более современной: http://open.mesosphere.com/getting-started/datacenter/install/

Это была проблема конфигурации zookeeper. Ни в одном из руководств не упоминается необходимость установки значений в zoo.cfg, кроме перечисления IP-адресов сервера. Вам также необходимо установить dataDir, syncLimit, initLimit, tickTime и clientPort.

person Céline Aussourd    schedule 07.10.2015
comment
I1014 18: 56: 32.746968 11494 logging.cpp: 172] Регистрация уровня INFO началась! I1014 18: 56: 32.748177 11494 main.cpp: 229] Сборка: 2015-10-12 20:57:28 от root I1014 18: 56: 32.748277 11494 main.cpp: 231] Версия: 0.25.0 I1014 18:56: 32.748345 11494 main.cpp: 234] Тег Git: 0.25.0 I1014 18: 56: 32.748406 11494 main.cpp: 238] Git SHA: 2dd7f7ee115fe00b8e098b0a10762a4fa8f4600f I1014 18: 56: 32.748615 11494 18: 56: 32.759768 11494 leveldb.cpp: 176] Открыл БД за 10.929155 мс I1014 18: 56: 32.763638 11494 leveldb.cpp: 183] Сжатый БД за 3,722708 мс I1014 18: 56: 32.763713 11494 leveldb.cppb: 198] Создан db итератор в 33931ns I1014 18: 56: 32.763761 11494 leveldb.cpp: 204] Обращается к началу базы данных в 8624ns I1014 18: 56: 32.764142 11494 leveldb.cpp: 273] Итерация по 1 ключу в базе данных в 352415ns I1014 18:56: 32.764263 11494 replica.cpp: 744] Реплика восстановлена ​​с позициями журнала 0 -> 0 с 1 отверстием и 0 невыученными I1014 18: 56: 32.767266 11520 log.cpp: 238] Попытка присоединиться к реплике в группу ZooKeeper I1014 18: 56: 32.767 493 11520 recovery.cpp: 449] Запуск восстановления реплики I1014 18: 56: 32.767623 11520 recovery.cpp: 475] Реплика в состоянии ГОЛОСОВАНИЯ I1014 18: 56: 32.767695 11520 recovery.cpp: 464] Процесс восстановления завершен I1014 18:56: 32.775274 11494 main.cpp: 465] Запуск Mesos master I1014 18: 56: 32.779567 11516 master.cpp: 376] Master 75abeaaa-a949-45a3-bd85-bebf100eecad (159.203.107.10) запущен 159.203.107.10:5050 I1014 18:56 : 32.779597 11516 master.cpp: 378] Флаги при запуске: --allocation_interval = "1secs" --allocator = "HierarchicalDRF" --authenticate = "false" --authenticate_slaves = "false" --authenticators = "crammd5" - authorizers = "local" --framework_sorter = "drf" --help = "false" --hostname = "159.203.107.10" --hostname_lookup = "true" --initialize_driver_logging = "true" --ip = "159.203.107.10 "--log_auto_initialize =" true "--log_dir =" / var / log / mesos "--logbufsecs =" 0 "--logging_level =" INFO "--max_slave_ping_timeouts =" 5 "--port =" 5050 "- quiet = "false" --quorum = "1" --recovery_slave_removal_limit = "100%" --reg istry = "replicated_log" --registry_fetch_timeout = "1 минута" --registry_store_timeout = "5 секунд" --registry_strict = "false" --root_submissions = "true" --slave_ping_timeout = "15 секунд" --slave_reregister_timeout = "10minsorter" --user = "drf" --version = "false" --webui_dir = "/ usr / share / mesos / webui" --work_dir = "/ var / lib / mesos" --zk = "zk: //159.203.107.10: 2181,159.203.107.151: 2181,159.203.107.162: 2181 / mesos "--zk_session_timeout =" 10secs "I1014 18:56:32. 779762 11516 master.cpp: 425] Мастер, разрешающий неаутентифицированным фреймворкам регистрацию I1014 18: 56: 32.779770 11516 master.cpp: 430] Мастер, разрешающий неаутентифицированным подчиненным регистрировать I1014 18: 56: 32.779778 11516 master.cpp: 467] Использование по умолчанию 'crammd5 'Authenticator W1014 18: 56: 32.779798 11516 Authenticator.cpp: 505] Учетные данные не указаны, запросы аутентификации будут отклонены I1014 18: 56: 32.779906 11516 Authenticator.cpp: 512] Инициализация сервера SASL I1014 18: 56: 32.791836 11515 master.cpp : 1542] Успешно прикрепленный файл '/var/log/mesos/mesos-master.INFO' I1014 18: 56: 32.792043 11519 contender.cpp: 149] Присоединение к группе ZK I1014 18: 56: 34.968217 11517 http.cpp: 336] HTTP GET для /master/state.json из 12.228.115.34:40863 с User-Agent = 'Mozilla / 5.0 (Macintosh; Intel Mac OS X 10_10_5) AppleWebKit / 537.36 (KHTML, например Gecko) Chrome / 45.0.2454.101 Safari / 537.36 'I1014 18: 56: 45.242039 11518 http.cpp: 336] HTTP GET для /master/state.json из 12.228.115.34:63018 с User-Agent = 'Mozilla / 5.0 (Macintosh; Intel Mac OS X 10_10_5) AppleWebKit / 537.36 (KHTML, например, Gecko) Chrome / 45.0.2454.101 Safari / 537.36 'I1014 18: 56: 55.319259 11519 http.cpp: 336] HTTP GET для /master/state.json из 12.228.115.34 : 50024 с User-Agent = 'Mozilla / 5.0 (Macintosh; Intel Mac OS X 1 - person Mark; 16.10.2015

согласно этой документации серверы настроены правильно

person Mark    schedule 12.11.2015