Kubernetes — Оператор Prometheus — Обнаружение Сбоя Истекающих Сертификатов

  • Автор темы Chileno
  • Обновлено
  • 20, Oct 2024
  • #1

Вчера у меня была ситуация, когда срок действия моего главного API-сертификата K8S истек, и в последние недели у меня был активен оператор Прометея, но ни 24-часовое, ни 7-дневное оповещение не сработало. Я подошел к панели управления и сделал исходный запрос, но ничего не получил. Я вырезал его и изменил на apiserver_client_certificate_expiration_секунды_count{job="apiserver"} > 0, получил результат всех узлов, проверил таймеры и модифицировал его на apiserver_client_certificate_expiration_секунды_count{job="apiserver"} > 14000000, поэтому мне нужен такой, который его собираются вырезать, и это было, мне это не помогает, но я думаю, что есть проблема с оповещением, кто-нибудь еще с этим боролся? https://github.com/kubernetes-monitoring/kubernetes-mixin/tree/master/runbook.md#alert-name-kubeclientcertificateexpiration Если предполагается, что это контролирует все конечные точки, которые отправляют запрос на сервер API для получения своих сертификатов, то это не удалось, поскольку я не получил предупреждение об истекшем сертификате.

#кубернетес #прометей

Chileno


Рег
02 Apr, 2011

Тем
64

Постов
223

Баллов
573
  • 25, Oct 2024
  • #2

Оповещение не работает, оно исправлено в дальнейших версиях миксинов, нам нужно применить on(job) перед гистограммой, чтобы это исправить. Пример: apiserver_client_certificate_expiration_секунд_count{job="apiserver"} > 0 и on(job) histogram_quantile(0,01, сумма по (job, le) (rate(apiserver_client_certificate_expiration_секунды_bucket{job="apiserver"}[5m]))) < 60432131800 и да, это означает, что ваши сертификаты не отслеживаются...

 

Abbastar


Рег
01 Oct, 2017

Тем
79

Постов
210

Баллов
625
Похожие темы Дата
Тем
403,760
Комментарии
400,028
Опыт
2,418,908

Интересно