Kubernetes version : v1.6.7
Network plugin : weave
Недавно я заметил, что весь мой кластер из 3 узлов вышел из строя. Выполнение моего начального уровня устранения неполадок показало, что /var
на всех узлах было 100%
.
Дальнейшее изучение журналов показало, что журналы были затоплены kubelet
, заявив
Jan 15 19:09:43 test-master kubelet[1220]: E0115 19:09:43.636001 1220 kuberuntime_gc.go:138] Failed to stop sandbox "fea8c54ca834a339e8fd476e1cfba44ae47188bbbbb7140e550d055a63487211" before removing: rpc error: code = 2 desc = NetworkPlugin cni failed to teardown pod "<TROUBLING_POD>-1545236220-ds0v1_kube-system" network: CNI failed to retrieve network namespace path: Error: No such container: fea8c54ca834a339e8fd476e1cfba44ae47188bbbbb7140e550d055a63487211
Jan 15 19:09:43 test-master kubelet[1220]: E0115 19:09:43.637690 1220 docker_sandbox.go:205] Failed to stop sandbox "fea94c9f46923806c177e4a158ffe3494fe17638198f30498a024c3e8237f648": Error response from daemon: {"message":"No such container: fea94c9f46923806c177e4a158ffe3494fe17638198f30498a024c3e8237f648"}
<TROUBLING_POD>-1545236220-ds0v1
инициировался из-за задания cron, и из-за некоторых неправильных конфигураций во время работы этих модулей возникали ошибки, и запускалось больше модулей.
Поэтому я удалил все задания и связанные с ними модули. Итак, у меня был кластер, в котором не было запущенных заданий/модулей, связанных с моим заданием cron, и я все еще вижу те же сообщения об ОШИБКАХ, заполняющие журналы.
Я сделал :
1) Перезапустите докер и kubelet на всех узлах.
2) Перезапустите всю плоскость управления
а также 3) Перезагрузите все узлы.
Но по-прежнему журналы переполнены теми же сообщениями об ошибках, хотя такие модули даже не раскручиваются.
Поэтому я не знаю, как я могу остановить kubelet от выбрасывания ошибок.
Есть ли способ сбросить сетевой плагин, который я использую? Или сделать что-то еще?