Я использую последнюю версию ядра sensu 0.26.1, настроил сервер sensu на одном компьютере с CentOS, настроил один клиент sensu на другом.
В одном клиенте sensu около 500 проверок, я продолжаю видеть "previous check command execution in progress"
в sensu-client.log, но каждая проверка на самом деле завершается очень быстро (большинство из них менее 0,1 секунды, а интервал составляет 60 секунд), я могу подтвердить это, запустив его под sensu
пользователем sudo su sensu -c "{run my check}"
.
Однако реальная ситуация была такова: на панели управления uchiwa показано, что многие из моих проверок выполнялись более 1 минуты, похоже, что клиент sensu серьезно завис/медленно, я пробовал следующие подходы:
- Удалите несколько длительных проверок и перезапустите сервер/клиент sensu.
- Добавить определение время ожидания к моим проверкам, ограничить время ожидания до 10, что привело ко многим проверкам "Время выполнения истекло".
- Я пробовал запускать только 1, 10, 50 проверок, вроде все работало нормально, однако, как только количество проверок достигало определенного числа, может быть 200-300, возникала проблема.
Ни один из вышеперечисленных способов не работает, есть ли способ отладить, какие проверки действительно блокируют? Или я могу настроить sensu, чтобы он просто убивал проверку, когда она превышала определение timeout
? Чтобы я не увидел в логе это сообщение "выполняется предыдущая команда проверки"
Меня заблокировали, нужна помощь :)