>nagios - это сильномогучая штука, спору нет, но мне бы что-нибудь менее
>пафосное. Чтобы оно просто смотрело, работает ли сервис, и при необходимости
>перезапускало его. Такое есть в природе?
Посмотри alertmon, я выложил текущую девелоперскую ветку alertmon 3:
http://www.opennet.me/dev/alertmon/alertmon3-dev.tar.gz
Текущее состояние - не написан WEB-интерфейс для отображения состояния сети из систем мониторинга и нет документации (правда комментариев в примере файла конфигурации должно хватить), само ядро для непосредственного мониторинга (topmon) с декабря у меня тестируется на рабочих серверах, его уже вполне можно использвовать.
Версия 3.0 полностью новый продукт, в корне отличающийся от предыдущих версий.
Код полностью переписан, переосмыслена технология работы и назначение программы.
Базовый модуль пакета alertmon переименован с alertmon.pl на topmon.pl,
директивы конфигурации вынесены в отдельный конфигурационный файл.
Модуль ориентирован в первую очередь на контроль состояния сервера на
котором он выполняется, тестирование внешинх серверов и сетевых сервисов
текущего осуществляется через внешние программы-плагины (см. директорию plugins.
Будут вопросы - пиши в тред.
Текущий TODO:
- подсистема сканирования логов, на предмет ошибок. <log_mon>
- SNMP plugin
- Контроль превышения размеров избранных директорий
- snmp
- список текущих алертов.
- данные для графика.
- выборка информации по алерту.
- чистильщик и архиватор старых логов
- CGI:
- Графики:
- статистика по хостам, с балансировкой величины значений, как сейчас.
- статистика по сервисам, с балансировкой величины значений.
- графики как все из серсии на одной странице, так и по одному.
- Алерты:
- текущий список алертов
- история алертов общая и по хостам.