Узел IBM Cloud Private работает, но службы не отвечают

Похоже, что один из моих узлов ICP работает, но службы на этом узле не отвечают и время от времени возвращают тайм-аут шлюза 504.

Когда я подключаюсь по SSH к неотвечающему узлу и запускаю journalctl -u kubelet -f, я вижу сообщения об ошибках, такие как transport: dial unix /var/run/docker/containerd/docker-containerd.sock: connect: connection refused

Кроме того, когда я запускаю top, я вижу, что dockerd использует обычно высокий процент моего процессора.

Что вызывает такое поведение и как я могу вернуть свой узел в нормальное рабочее состояние?


person James Young IBM    schedule 21.02.2018    source источник


Ответы (1)


Эти ошибки могут быть связаны с известной проблемой Docker, когда старая ссылка containerd используется даже после перезапуска демона containerd. Этот дефект приводит к тому, что демон Docker переходит во внутренний цикл ошибок, который использует большое количество ресурсов ЦП и регистрирует большое количество ошибок. Дополнительные сведения об этой ошибке см. в обновить удаленные контейнеры при перезапуске containerd. против проекта Moby.

Чтобы обойти эту проблему, используйте команду операционной системы хоста, чтобы перезапустить службу Docker на узле. Через некоторое время службы должны возобновиться.

person James Young IBM    schedule 21.02.2018