Статус узлов по-прежнему DOWN после перезапуска серверов

У меня есть роевой кластер, содержащий 4 узла: 1 менеджер + 3 рабочие

При перезапуске одного рабочего сервера его статус становится "DOWN" при выполнении:

docker node ls

Также уже развернутые сервисы останавливаются в этом узле (выходят контейнеры) и не могут его перезапустить. Я пытался:

  • пересоздавать кластер после каждой перезагрузки (слишком некрасиво и не решает проблему)
  • удаление тяжелого файла /var/lib/docker/swarm/worker/tasks.db (ситуацию не улучшает)
  • просто жду (но он все еще не работает в нерабочее время)

Я использую докер 18.09ce

Предложения?


person firasKoubaa    schedule 20.06.2019    source источник


Ответы (1)


Есть несколько вещей, которые вы должны сделать.

  1. Обновить доступность узла (выполнить команду с узла менеджера)

    обновление узла докера ‹> --availability активно

  2. Если проблема не устранена, попробуйте выполнить следующие действия.

    // Снова добавляем работника в рой, используя ранее сгенерированный токен.

  3. Если все еще не решено, вы можете сделать следующее: удалить все узлы из кластера.

    docker swarm init --force-new-cluster // Используйте с осторожностью.

    Восстановить docker swarm

person dotnetstep    schedule 13.07.2019