Мешающие метрики на панели управления DC/OS после смены мастер-ноды

После замены двух из трех мастер-узлов в кластере DC/OS 1.8 на более новую версию CoreOS (один с ядром, исправленным против уязвимости DirtyCOW) мастера перестали работать. Приборная панель показывала пустой дата-центр.

Мы синхронизировали /var/lib/dcos со старого главного узла на два новых главных узла. После этого приборная панель снова заработала. На приборной панели DC/OS по-прежнему отображаются колеблющиеся показатели. У нас есть лидер mesos.leader и руководитель зоопарка.

Как мы можем стабилизировать кластер?


person André Veelken    schedule 11.11.2016    source источник
comment
Кластер DCOS изначально был запущен с официальным шаблоном zen-3 CloudFormation, а новые мастера используют тот же LaunchConfiguration , пользовательские данные (cloud-config) и т. д.   -  person André Veelken    schedule 11.11.2016


Ответы (1)


В прошлый раз, когда это случилось с нами, нам пришлось переустанавливать кластер. Я только что закончил останавливать наши главные узлы по одному, чтобы увеличить размер диска. Теперь мы снова в колеблющемся состоянии. Я думаю, что переустановка в нашем будущем. Сейчас я ищу ответы, чтобы избежать этого.

person Steve Mitchell    schedule 18.03.2017
comment
Да, в итоге мы построили новый кластер. Даже если ваш кластер DC/OS имеет автомасштабирование на уровне частного агента, общедоступного агента и на уровне мастеров. Группа мастеров является самой хрупкой частью, и вы не можете переключить, например, группу из трех человек на более новые операционные системы здесь за короткое время. - person André Veelken; 20.03.2017