Синкен Согласно официальному сайту, Shinken — это система мониторинга; переписан с нуля на Python Nagios Core, с улучшенной поддержкой больших сред и большей гибкостью.
Масштабируемость
В соответствии с документация , каждый тип используемого процесса может выполняться на отдельном хосте.Это очень полезная функция, поскольку вы можете захотеть разместить базу данных в самом дешевом месте, процессы сбора информации в каждом центре обработки данных и процессы уведомлений ближе к вашему физическому местоположению.
Пользователь Shinken на диаграмме счастлив, это определенно хороший знак:
Данная система также имеет готовую конфигурацию для межрегионального мониторинга, называемую Царства (Сферы).
Здесь можно заметить нечто удивительное: информация собирается в региональные базы данных, а не в одну главную базу данных.
Существует также меньший вариант конфигурации сферы для небольших распределенных конфигураций, для установки которых требуется всего одна база данных и несколько хостов:
Еще одна болевая точка при оценке масштабируемости — отказоустойчивость.
Процитирую эту информацию из документации:
Никто не идеален.Сервер может дать сбой, как и приложение, поэтому у администраторов есть подмены: они могут взять конфигурацию упавших элементов и пересобрать их.
На данный момент единственный процесс, не имеющий замены – это Арбитр, но в будущем он будет усовершенствован.
Armibr регулярно проверяет, доступны ли все остальные процессы, и если планировщик или другой процесс не работает, он отправляет свою конфигурацию на другой узел, определенный администратором.
Все процессы уведомляются об этом изменении, чтобы они могли использовать новый узел для доступа к процессу и не пытались использовать сломанный.
Если узел был потерян из-за проблем с сетью и снова подключился к сети, арбитр заметит это и попросит заменяющий узел сбросить свою временную роль.
Интеграция с системами управления конфигурациями
Автоматическое обнаружение хостов и сервисов — это хорошо охвачено документацией , а поскольку конфигурация хранится в файлах, ее можно довольно легко сгенерировать с помощью Chef\Puppet на основе информации, уже доступной в системе конфигурации (например, PuppetDB).
Регистрация действий
Поскольку конфигурация хранится в файлах, вы можете использовать существующие инструменты, такие как контроль версий (Git, Mercurial), для отслеживания изменений и их владельцев.В документации я не нашел подтверждений того, что Shinken записывает действия пользователя где-либо в веб-интерфейсе.
пользовательский интерфейс
Синкен веб-интерфейс По заверениям использующих его людей, он хорошо зарекомендовал себя при работе с тысячами машин и десятками групп.
Недостатки
Изучив документацию, я не обнаружил видимых недостатков.Единственное, что меня смущает, это быстрое развитие в прошлом и очень медленная скорость фиксации в настоящее время: около 40 в этом году, большинство из них — это поток пул-реквестов с исправлениями ошибок.
Система либо слишком хороша для дальнейшего развития (чего не бывает в природе, даже такие старички, как vim и emacs, получают новые релизы), либо теперь это очередной открытый проект с недостаточно большим сообществом или проблемами с мейнтейнером - вот в чем проблема.
такая информация, которую мне хотелось бы знать, прежде чем использовать такую сложную вещь, как система мониторинга.
Фредерик Моье , который когда-то был в команде разработчиков Shinken, любезно предоставил информацию по этому вопросу: более года назад несколько разработчиков из команды, несогласные с политикой разработки, покинули проект и сделали форк под названием Алиняк , в настоящее время находится в активной разработке, первый стабильный выпуск (1.0) запланирован на декабрь 2016 года.
Ссылки
Сенсу
Sensu — это фреймворк для мониторинга (или платформа, как они себя называют), а не готовая система мониторинга.К ее сильным сторонам относятся:
- Интеграция с Puppet\Chef — определите, что проверять и куда отправлять уведомления прямо в вашей системе управления конфигурациями.
- Использование существующих технических решений, где это возможно, вместо изобретения велосипедов (Redis, RabbitMQ)
Обработчики могут отправлять сообщения, делать что-то на сервере или делать что-то еще, чему вы их научите.
Масштабируемость
Sensu имеет гибкую архитектуру, поскольку каждый компонент можно дублировать и заменять несколькими способами.
Пример простой отказоустойчивой системы описан в следующая презентация ; вот общая схема:
С HAProxy И Redis-Сентинел вы можете построить систему, в которой при наличии хотя бы одной работающей машины каждого типа (Sensu API, Sensu Dashboard, RabbitMQ, Redis) мониторинг будет продолжать работать без какого-либо ручного вмешательства.
Интеграция с системами управления конфигурациями
Встроенный (Puppet, Chef, EC2?!), но только в оплаченный версия, что плохо, особенно если у вас тысячи серверов и вы не хотите платить за то, что имеет бесплатные аналоги.
Регистрация действий
Встроенный , правда, только в платной версии.
пользовательский интерфейс
Интерфейс по умолчанию для Sensu, Учива , имеет множество ограничений.
Это выглядит слишком просто для среды с тысячами хостов, выполняющих широкий спектр ролей.
Платная версия имеет собственную панель управления, но она мало чем отличается от бесплатной версии и добавляет лишь несколько функций открытой версии, которые отключены «из коробки».
Недостатки
- Отсутствие исторической информации и очень ограниченные возможности создавать проверки на ее основе;
- Подход «сделай сам» — нет готового мониторинга, который можно было бы включить для вашей системы сразу после установки;
- Агрегирование событий — задача нетривиальная;
-
Замысловатая отправка сообщений, что пугает (потому что это та часть системы, которая должна быть самой простой и надежной)- неправда, у меня сложилось неправильное впечатление документация , Спасибо x70b1 в целях разъяснения; - Путь «мы не хотим изобретать велосипед» имеет свои ограничения, которые могут быть вам знакомы, если вы когда-либо использовали подобные системы (в моем случае это была система мониторинга).
Прометей , что оставило пользователю ряд функций, например, авторизация\аутентификация\идентификация).
Ссылки
Исинга 2
Icinga — это форк Nagios, переписанный с нуля во второй версии.
В отличие от Синкена, этот живой, часто обновляется проект.
Масштабируемость
Общая архитектура:Icinga 2 хорошо продумана распределенная схема мониторинга .
Единственный минус, который я обнаружил при настройке тестового кластера, — это сложная первоначальная настройка даже самой простой распределенной схемы.
Интеграция с системами управления конфигурациями
Интеграция довольно хорошая, вот две презентации по теме: Дорога к ленивому мониторингу с помощью Icinga 2 и Puppet Том де Вилдер и Icinga 2 и Puppet: автоматизированный мониторинг Уолтер Хек.Ключевой особенностью Icinga является хранение конфигурации в файлах, что позволяет легко генерировать конфигурацию с помощью Puppet, что в моем случае произошло с помощью PuppetDB как источник информации обо всех хостах и сервисах.
Регистрация действий
Как я обнаружил, в модуле предусмотрено логирование действий директор .В настоящее время в IcingaWeb2 нет встроенной поддержки аудита.
пользовательский интерфейс
IcingaWeb2 выглядит как хороший пользовательский интерфейс с множеством дополнений для разных нужд. Судя по тому, что я видел, он выглядит наиболее гибким и расширяемым, но при этом поддерживает все функции, которые можно ожидать «из коробки».
Недостатки
Единственный недостаток, с которым я столкнулся, это сложность первоначальной настройки.
Нелегко понять взгляд Icinga на мониторинг, если вы ранее использовали что-то совершенно другое, например, в моем случае, Zabbix.
Забфикс
Zabbix — стабильная и надежная система мониторинга с устойчивыми темпами развития.
У него огромное сообщество пользователей, и на большинство вопросов, которые вы задаете, где-то уже есть ответы, поэтому вам не придется беспокоиться о том, возможно ли то или иное в Zabbix.
Масштабируемость
Сервер работает с одной базой данных, и независимо от ваших действий, при любых других имеющихся ресурсах (память, сеть, процессор) в какой-то момент вы столкнетесь с ограничениями ввода-вывода на диске, используемом базой данных.С 6000 IOPS в Амазонка поддерживаем около двух тысяч нвпс, новые значения в секунду, что неплохо, но все же оставляет желать лучшего.
Прокси и разделение База данных повышает производительность, но с точки зрения отказоустойчивости у вас по-прежнему есть одна база данных, которая является точкой отказа для всей системы.
Интеграция с системами управления конфигурациями
Zabbix плохо подготовлен к разнообразной среде, управляемой системой управления конфигурацией.Имеет встроенные возможности для обнаружение низкого уровня хосты и сервисы, но они имеют свои ограничения и не привязаны к системе конфигурации.
Единственная возможность такой интеграции — собственное решение с использованием API.
Регистрация действий
Zabbix хорошо регистрирует действия пользователя, за исключением одного «слепого пятна»: изменений, внесенных через API. в основном не регистрируется что может быть для вас проблемой, а может и не быть.Еще хотелось бы отметить, что все проблемы с Zabbix фиксируются где-то в баг-трекере, и если они получают достаточно внимания со стороны сообщества, то рано или поздно они будут исправлены.
пользовательский интерфейс
Пользовательский интерфейс Zabbix удобен для пользователя и включает в себя множество функций.
Минус в том, что его практически невозможно расширить; вы либо смиряетесь с тем, что предлагает вам стандартный дашборд, либо создаете свой собственный.
Доработка стандартного пользовательского интерфейса — весьма нетривиальная задача из-за своей сложности.
Недостатки
- Просто базовая аналитика того, что происходит в данный момент (не с точки зрения текущих проблем, а с точки зрения частот происхождения и подобной информации).
Ситуация значительно улучшилась с появлением в версии 3.0 «100 лучших триггеров для стрельбы»;
- Настройка обслуживания (сопровождения), в отличие от систем на базе Nagios, не может быть задана на уровне триггера и была достаточно сложной до недавней переделки 3.2;
- Генерация оповещений «из коробки» оставляет желать лучшего (что, впрочем, является проблемой каждой отдельно взятой системы мониторинга).
В нашем случае нам пришлось разработать внешнюю систему агрегирования оповещений (возможно, когда-нибудь она будет опубликована в открытом исходном коде);
- Исследование проблем с производительностью без соответствующего опыта превращается в беспорядок, поскольку у вас есть один неделимый сервер, который необходимо диагностировать.
Отказ от ответственности
Это длинный пост с множеством картинок и еще большим количеством текста.Здесь вы не найдете четкого ответа на простые вопросы типа «что лучше», а информацию, позволяющую ответить на эти вопросы, исходя из вашего опыта и желаний.
Я рассматриваю запуск Linux и мониторинг Linux-хостов, поэтому поддержка системой различных платформ не учитывалась.
Также в качестве условия было взято требование иметь возможность контролировать тысячи машин и тысячи сервисов.
На мой взгляд, только Zabbix и Icinga 2 достаточно зрелы для использования на «предприятии», главный вопрос, который должен задать себе тот, кто выбирает систему — какая философия мониторинга ему ближе, поскольку обе они позволяют получить один и тот же результат, используя совершенно разные подходы.
Теги: #*nix #Системное администрирование #Администрирование серверов #DevOps #мониторинг #zabbix #сравнение #Icinga #shiknen #sensu #icinga 2 #сравнение мониторинга
-
Социологические Опросы И Отношение К Ним.
19 Oct, 24 -
Comby.ru Стал «Бесплатным»
19 Oct, 24 -
Hyperbaton: Икеа Для Сайтов
19 Oct, 24