Грейлог
Поскольку два человека уже посоветовали вам переосмыслить текущий процесс (я поддерживаю это, поскольку в какой-то момент из-за этого у вас будут бессонные ночи ;)), я пойду другим путем и порекомендую конкретное программное обеспечение, которое, по моему мнению, подходит для большинства ваши потребности: Грейлог.
Я реализовал и использовал пару ELK складывает как для агрегации журналов, так и для бизнес-аналитики, а также запускать/поддерживать Graylog уже около двух лет у моего нынешнего работодателя. Я рекомендую Graylog, поскольку он имеет следующие встроенные функции и, на мой взгляд, его немного проще в настройке и обслуживании:
- Веб-интерфейс
- Многопользовательские возможности
- Оповещение
Насколько я понимаю ваш сценарий, похоже, что вам нужно действовать или получать оповещения об определенных событиях, которые появляются в потоке сообщений журнала. Если мы посмотрим на Возможности серого журнала:
Запускайте действия или получайте уведомления, когда что-то требует внимания, например, неудачные попытки входа в систему, исключения или снижение производительности.
Идеи: отправьте электронное письмо или сообщение в Slack своей команде. Создайте новую машину, чтобы сбалансировать вычислительную нагрузку. Автоматически блокируйте диапазоны IP-адресов в брандмауэрах при обнаружении атаки.
Чтобы попробовать Graylog, я бы рекомендовал выполнить следующие два шага:
- Настройте выделенный хост, доступный всем хостам приложений, для запуска Graylog (и его зависимостей MongoDB и ElasticSearch).
- Отправляйте журналы из вашего приложения в Graylog (возможно, как ГЕЛЬФ сообщения)
Примечание. Эти два шага могут заполнить страницы передового опыта и должны вызвать хотя бы пару мыслей. Не говоря уже о том, что Graylog не является решением для мониторинга, а сам Graylog должен отслеживаться с помощью подходящего инструмента мониторинга (например, Icinga, Prometheus, Nagios и это лишь некоторые из них).