После двух с половиной лет разработки представлен (http://www.zabbix.com/rn2.0.0.php) релиз новой стабильной ветки открытой системы мониторинга Zabbix 2.0 (http://www.zabbix.com). Zabbix состоит из трёх базовых компонентов - сервера для координации выполнения проверок, формирования проверочных запросов и накопления статистики, агентов для осуществления проверок на стороне внешних хостов и фронтэнда для организации управления системой. Для снятия нагрузки с центрального сервера и формирования распределённой сети мониторинга может быть развёрнута серия прокси-серверов, агрегирующих данные о проверке группы хостов. Код агентов и серверной части написан на языке Си, для разработки web-интерфейса использован язык PHP, данные могут храниться в СУБД MySQL, PostgreSQL и SQLite. Код проекта распространяется под лицензией GPL.<center><a href="http://www.zabbix.com/documentation/_media/2.0/manual/introd... src="http://www.opennet.me/opennews/pics_base/0_1337795228.png" style="border-style: solid; border-color: #e9ead6; border-width: 15px;" title="" border=0></a></center>
Ключевые новшества (http://www.zabbix.com/documentation/2.0/manual/introduction/...) Zabbix 2.0:
- Мониторинг через отслеживание поступления SNMP-трапов;
- Поддержка БД SQLite3 для хранения данных на сервере и для обеспечения работы web-интерфейса. SQLite позволяет развернуть систему мониторинга на системах, на которых невозможно запустить СУБД PostgreSQL или MySQL из-за нехватки ресурсов;
- Автоматический выбор пиктограмм для элементов карты сети. Например, для хостов, коммутаторов и различных сетевых устройств могут быть заданы разные изображения. В поставку включён новый набор пиктограмм с изображением элементов карты сети. Для каждого типа элементов карты может быть определён свой формат меток. Возможность выделения группы элементов на карте сети;
- Поддержка экспорта лога событий в формате CSV;
<center><a href="http://www.zabbix.com/documentation/_media/2.0/manual/introd... src="http://www.opennet.me/opennews/pics_base/0_1337797647.png" style="border-style: solid; border-color: #e9ead6; border-width: 15px;" title="" border=0></a></center>
- Автоматическое получение данных для заполнения профиля хоста, например, определение информации об оборудовании и используемом на хосте ПО. Автоматическая регистрация хостов на основе пассивных проверок. Расширенные средства автоматического выявления новых сервисов и объектов в сети через выполнения сканирования и проверок с использованием HTTPS и Telnet. Автоматическое заполнения DNS-имён для выявленных и автоматически зарегистрированных новых устройств;
- Поддержка низкоуровневого определения параметров объектов мониторинга на хосте. Например, настройка параметров файловой системы, сетевых интерфейсов и SNMP-интерфейсов теперь осуществляется без ручного вмешательства;
- Возможность подключения пользовательских скриптов для запуска любых команд на проверяемом хосте через Zabbix Agent и IPMI;
- Поддержка мониторинга web-серверов через внешние прокси (например, можно проверить доступность сервиса из разных частей сети);
- Новый набор предлагаемых по умолчанию шаблонов;
- Поддержка кэширования данных, связанных с работой триггеров, что позволяет сократить число обращений к БД и увеличить общую производительность сервера;
- Увеличена гибкость настройки выполнения удалённых команд через Agent, IPMI и SSH;
- Поддержка мониторинга внешних Java-приложений и промежуточного ПО (JBoss, WebSphere и WebLogic) с использованием JMX;
- Единый унифицированный профиль хостов, вместо ранее разделённых базового и расширенного профилей;
- Опциональная возможность раскрытия макросов в режиме редактирования карты сети;
- Возможность задания видимого имени хоста или шаблона, которое будет отображаться в web-интерфейсе вместо фактического имени хоста или шаблона;
- Новые макросы: {IPADDRESS}, {HOST.DNS} и {HOST.CONN} для имён триггеров; {ITEM.ID} и {TRIGGER.EXPRESSION} для уведомлений;
- Возможность проверки нескольких сетевых интерфейсов на наблюдаемом хосте. Возможно назначение разных проверок для разных IP, привязанных к одному хосту;
- Переход на использование gettext для организации перевода элементов web-интерфейса;
- Возможность определения в шаблонах дополнительных графиков и блоков с информацией для определённых типов хостов;
- Проведение оптимизации схемы хранения данных в СУБД для увеличения согласованности и безопасности конфигурации и статистики изменении состояний;
- Данные об изменении состояний могут записываться с наносекундной точностью;- Изменение оформления экрана входа в web-интерфейс и конфигурационных форм. Поддержка сортировки триггеров (по времени, по степени важности и по хосту);
- Поддержка определения фильтров на уровне Zabbix API.
URL: http://www.zabbix.com/rn2.0.0.php
Новость: http://www.opennet.me/opennews/art.shtml?num=33923
Отличная система.
Пересели на неё после нагиоса и коленных скриптов.
Единственный её минус, пожалуй - ресурсов жрёт много, но для этого придумали мощное железо :).
Завтра попробую на тестовом сервере обновить текущую систему до 2.0 и посмотреть как будет работать.
тестовая система фрибсд? или пакеты будете руками накатывать?
>тестовая система фрибсд? или пакеты будете руками накатывать?Заббикс у нас на убунте серверной живёт. Есть старый НАТ, который мы не используем в продакшне, зато успешно на нём проводим эксперименты, в том числе и с тем как работают или как обновятся разного рода используемые нами программы. В данном случае я просто подниму на нём убунту, перенесу базу оборудования со старой версии на заббикс 2.0 и будем смотреть какое-то время как оно работает и в случае, если всё устроит - обновимся.
Какой у вас примерно объем данных? В кэш ФС помещаются или приходится нещадно пилить диски?
>Какой у вас примерно объем данных? В кэш ФС помещаются или приходится нещадно пилить диски?На сервере шелла не имею, потому не скажу точно. Около 2500 объектов для мониторинга. Из которых большинство - L2 свичи, Access Point`ы, shdsl модемы, сервера.
Заббикс по snmp снимает информацию по загрузкам на sfp портах свичей, статистику пинга (отклик, потери), состояние портов, WiFi статус P2P соединений.
До этого юзали нагиос+ррдтул+несколько самописных скриптов под свои нужды, но всё это успешно заменилось заббиксом :).
Кстати а что именно жрёт? У меня БД не кисло хавало. У них в форуме и ещё по куче мест нашёл как таблицы по другому создать, плюс хаускипер покрутить. Вроде нормально стало. Но это на тестовом сервачке и 1.8. Интересней посмотреть бы что там яндекс сделал. В их презенташке интересно было расписано.
осталось только дождаться включения заббикса 2.0 в репы стабильных дистрибутивов.
Можно же checkinstall юзать и обновляться средствами менеджера пакетов. Пожалуй, попробую мигрировать на него в качестве теста.
пакет собрать конечно так трудно.
> пакет собрать конечно так трудно.Спасибо добрым людям, уже собрали, если кто сам не желает.
https://launchpad.net/~h.tims/+archive/upstream-experimental...
Надо будет пощупать новую игрушку.
Система меня все больше поражает, чем больше ее начинаешь изучать тем больше нравится.
Пробовал нагиос, но как-то не очень понравился.
Да простят меня разработчики Zabbix, огромная благодарность им за работу (2.0 обязательно посмотрю, давно ждал поддержки трапов из коробки, кстати как там с удобоваримой загрузкой MIB из коробки?), но немного не по теме:
Посмотрите Icinga ( http://icinga.org ) - форк nagios, имеет приятный современный интерфейс и снабжена приятным количеством плюшек. Система однозначно достойна внимания.
Низкоуровневое обнаружение - это прорыв. Например, не нужно будет создавать кучу шаблонов для мониторинга портов сетевых устройств, одного шаблона будет достаточно. Аналогично для файловых систем и сетевых устройств.Картинки устаревшие и неудачные. 2.0 выглядит совсем не так. :) Надеюсь на странице Заббикса обновят их, пока там только 1.8.
руки оторвать авторам и засунуть их им в то место которым они думают.под реальной нагрузкой оно не живет. постоянные танци с бубном, правка SQL, растановка нормальных индексов итд...
хотя если десятки серверов + десятки свичей. да удобно.
достаточно просто чуток подумать и сделать простой вывод: у всех работает, а у тебя нет.
так мтожет проблема не в заббиксе?
Я не знаю что тако для Вас реальная нагрузка, но у меня 1.8 163 сервера мониторит на ура с большим колвом тригеров.
163? Всего-то?Количество узлов сети (под наблюдением/без наблюдения/шаблоны) 459 397 / 0 / 62
Количество элементов данных (активных/деактивированых/не поддерживаются) 34992 34972 / 4 / 16
Количество триггеров (активированных/деактивированных)[проблема/неизвестно/ок] 2046 2044 / 2
Всё это нормально живёт вместе с Cacti (там узлов еще больше, просто Zabbix не очень давно появился) на одном средненьком "сервачке" порядка Q6600/8Gb, и не жалуется. Планируем увеличить число отслеживаемых узлов до 1500, но уже на отдельном сервере - Cacti всё-таки тяжелый для совмещения с чем-либо.
Я, пардон, не членами меряюсь, а к делу. Так-что не обессудьте.Все сходится к тому, что автор оригинального поста сам имеет руки растущие из заднего прохода и мозг видимо рядом с руками.
> Я, пардон, не членами меряюсь, а к делу. Так-что не обессудьте.
> Все сходится к тому, что автор оригинального поста сам имеет руки растущие
> из заднего прохода и мозг видимо рядом с руками.Видимо так оно и есть. Либо совсем уж кислое железо.
Себе руки оторвите, даже яндекс его использует
> Себе руки оторвите, даже яндекс его используетну если ДАЖЕ yandex то это очень серьезный аргумент о качестве продукта.
я бы не советовал во всем следовать за yandex а то вдруг там есть сотрудники нетрадиционной ориентации...
всем желавшим оторвать мне руки и отдельно тому кто мониторит АЖ! 163 серверов посвящается:
я не буду всех оскорблять, как это тут принято, стар я для этого.
просто объясню более подробно о чем я говорил.
для примера берем 15000 девайсов и мониторим на каждом из них примерно 500 параметров, потом добавляем к этому примерно 50 рабочих мест(что собственно и похоронит всю конструкцию) на которых открыта главная сводная табличка показывающая что и где произошло. восхищаемся скоростью работы сего чуда и открываем исходники чтобы посмотреть как собственно 50 пользователей убивают все это нафиг и чем же занят мускул. смотрим на структуру базы данных, удивляемся. смотрим на селекты, смеемся. смотрим как расставлены индексы, не понимаем. правим индексы и селекты - начинает работать.
дальше берем двух студентов часа 4 обясняем что надо сделать и даем им 100 000 рублей и они за месяц делают тоже самое работающее на говёном Q6600.
а так да. если надо мониторить 163 сервера - то ДА очень удобно.
и ДА! качество кода лучше чем может выдать секретарша.
> для примера берем 15000 девайсов и мониторим на каждом из них примерно
> 500 параметров, потом добавляем к этому примерно 50 рабочих местИ вот тут как раз надо выпрямлять руки, ибо это не много, и при должном распределении системы на несколько машин (а 15000 девайсов с одного сервера может мониторить только криворучка) всё будет работать нормально. У MySQL тоже есть масса параметров, которые нужно править с учетом нагрузки, ну и да - если где-то индексов не хватает, можно без воплей построить, и не мучаться.
> дальше берем двух студентов часа 4 обясняем что надо сделать и даем им 100 000 рублей и они за месяц делают тоже самое работающее на говёном Q6600.Можно ссылку на работающее решение?
Вот кому руко то оторвать. У меня гораздо больше всего и все работает без проблем. Авторам респект огромный.
Всё отлично. Вот только конвертация БД с 1.8 долго проходит. Я бы даже сказал неприлично долго :)
Это по причине изменения структуры исторических таблиц, так как добавилась поддержка наносекунд. 20 гигабайтная база данных конвертируется за 5-7 минут на быстрой машине с 14 гигабайтами выделенными под InnoDB memory pool в MySQL.
Я, кстати, не совсем понял что "добавилась поддержка наносекунд" значит и зачем оно надо. Поясните, пожалуйста.
Появляется пока не реализованная возможность собирать данные чаще чем раз в секунду. Теоретическим пределом становится наносекунда, а не секунда как было раньше.При отсылке сообщений Zabbix теперь может точно сказать какие данные привели к проблеме. В предыдущих версиях ето не всегда было возможно особенно для лог файлов, сейчас каждая строчка файла уникально идентифицируется временем с наносекундами на стороне Zabbix'a.
fixed
Well done!!!Да, за последнее время видны значительные улучшения в системе. Ребята двигаются в правильном направлении. Я рад за них.
Zabbix, по истине, постепенно становиться лучшей системой мониторинга.
P.S.
Надеюсь там не очень много багов. ;) Или стои подождать 2.0.1...
> Zabbix, по истине, постепенно становиться лучшей системой мониторинга.Ну тут не стоит забывать еще и о Zenoss.
Юзаю с 2009года одни положительные эмоции!
К сожалению заббикс все так же остается не приспособленным для применения в энтепрайзе. Два ключевых пункта висят в багах уже сто лет а разрабы не чешутся, первый пункт это "запустить монитор сейчас", а второй более обширный но суть одна мониторы и триггеры могут переходить в состояние unknown/unsupported в произвольном порядке и никаких алертов не генерируется.
> К сожалению заббикс все так же остается не приспособленным для применения в
> энтепрайзе. Два ключевых пункта висят в багах уже сто лет а
> разрабы не чешутся, первый пункт это "запустить монитор сейчас", а второй
> более обширный но суть одна мониторы и триггеры могут переходить в
> состояние unknown/unsupported в произвольном порядке и никаких алертов не генерируется.Они не всем нужны и важны.
Запустить монитор "сейчас" - можно. Деактивировать и активировать элемент снова, например. Зачем - вопрос спорный.Насчет unknown-unsupported - это все же не realtime мониторинг. Возможны задержки, особенно если сервис высоконагруженый. Критичные сервисы мы подперли монитом или скриптами и это не мешает заббиксу собирать статистику и рисовать графики.
Предложите свой вариант enterprise мониторинга?
Не знаю. Мне единственно что интересует - тикет на нетфлоу. Который несколько лет как висит а подвижек никаких. Вот это была бы вещь.
поподробнее можно?
Можно поискать по их форуму. Люди хотят нетфлоу из коробки. У них даже тикет был заведён - сделать поддержку нетфлоу. Вроде кто-то хотел коллектор туда вкрячить, но сказали мол базулька такого не выдержит. И тема потихоньку заглохла.
> Можно поискать по их форуму. Люди хотят нетфлоу из коробки. У них
> даже тикет был заведён - сделать поддержку нетфлоу. Вроде кто-то хотел
> коллектор туда вкрячить, но сказали мол базулька такого не выдержит. И
> тема потихоньку заглохла.Хм. Нетфлоу - это совсем другой коленкор, системы мониторинга какбэ не предназначены для учета трафика.
> Хм. Нетфлоу - это совсем другой коленкор, системы мониторинга какбэ не предназначены для учета трафика.Как бы да. Но интеграция мониторинга с нетфлоу в один продукт это было бы кул. Поговаривают даже в ентерпрайз версиях разных продуктов, за большие деньги, нормально интеграция не сделана - допиливают на месте. А если подумать это было бы просто отлично. Мониторишь поток на порту, тут же можешь посмотреть кто вызвал вот этот скачок скорости. Поставить тригер на превышение определённого типа трафика( допустим смтп ). Да кучу всего хорошего можно придумать.
> Как бы да. Но интеграция мониторинга с нетфлоу в один продукт это
> было бы кул. Поговаривают даже в ентерпрайз версиях разных продуктов, за
> большие деньги, нормально интеграция не сделана - допиливают на месте. А
> если подумать это было бы просто отлично. Мониторишь поток на порту,
> тут же можешь посмотреть кто вызвал вот этот скачок скорости. Поставить
> тригер на превышение определённого типа трафика( допустим смтп ). Да кучу
> всего хорошего можно придумать.Так все ж просто. Вешаете нетфлоу-коллектор, задаете типы трафика и прочее для выгрузки в базу, и пара простейших скриптов анализа содержимого базы. Подвешиваете эти скрипты в заббикс - вуаля, цель достигнута. А совмещать ужа с ежом без надобности - получится монстр типа Windows 8.
Ента не совсем то. Графики так просто не выгнать, в один интерфейс не запихнуть. Самодельный лисапед какой-то. И уж точно тот лисапед что я попытаюсь собрать будет хуже nfsen.
А охота именно пару метров колючей проволоки!
> Ента не совсем то. Графики так просто не выгнать, в один интерфейс
> не запихнуть. Самодельный лисапед какой-то. И уж точно тот лисапед что
> я попытаюсь собрать будет хуже nfsen.
> А охота именно пару метров колючей проволоки!Какие еще графики? Вам мониторинг или систему учета трафика? Ужа с ежом вы вряд ли когда-либо увидите, поскольку совершенно разные паттерны нагрузки, и если ставить - то по определению на разные серверы.
> Какие еще графики? Вам мониторинг или систему учета трафика? Ужа с ежом вы вряд ли когда-либо увидите, поскольку совершенно разные паттерны нагрузки, и если ставить - то по определению на разные серверы.Ну смотри. Снимаешь ты графики с портов железки, сервачка. Смотришь - а в выходные был скачок, письмецо на почту упало - мол алярм. Ты тут же, в том же интерфейсе смотришь трафик в разрезе за нужное время. Это же быстрее и проще. Там оказывается что кто-то почтишку прокачивал в больших объёмах - опа червячок с нескольких компов. Думаешь надо на это дело триггер прикрутить. Другой скачок - всё нормально, бухи вышли на выходные и лили в шаринг документы. И прикручиваешь в одном и том же месте, единообразно. А не: общий трафик - залезем сюда, пропишем в триггерах то; трафик определённого типа - лезем совершенно в другое место, прописываем триггеры по другому.
ЗЫ: а что в мониторинг не входят графики? Не слыхал я что-то про мегаумную систему что зависимости может обнаруживать сама - максимум тренд из двух точек построит. Приходится регулярно на графики глазами смотреть. Допустим так сразу обнаружил большие прокачки между 2 разными филиалами, из нескольких десятков. Размещение ресурсов криво сделано - вот и качают туда-сюда. И как бы я это без графиков обнаружил? Или какая температура в одном помещении. Датчик там есть температурный, только по нему судить это большой лаг. А можно по току, который жрёт оборудование в помещении - так гораздо раньше поймать можно перегрев. И как бы я без графиков это всё обнаружил?
О чем речь вообще? Zabbix умеет графики строить.
Разбор же Netflow - совершенно отдельная задача в данном контексте.
Разбирайте скриптами и вгружайте значения в Zabbix, о чём вопрос-то?
Вопросов нет. Хочу всё сразу и без хлеба. Разговор как бы об этом, а не о том что я могу скриптами там накарябать всё что угодно. Это надеюсь понятно? Или видео презентацию короткую надо подготовить, где будет показано что в интерфейсе забикса я не могу тыкнуть трафик так чтобы показалось распределение по ип,портам,протоколам и тут же повесить на превышение определённого типа трафика с определённого ип триггер?
> Или видео презентацию короткую надо
> подготовить, где будет показано что в интерфейсе забикса я не могу
> тыкнуть трафик так чтобы показалось распределение по ип,портам,протоколам и тут же
> повесить на превышение определённого типа трафика с определённого ип триггер?Zabbix - это система мониторинга сети, а не учёта трафика и downdrill-репортинга... Мониторинг собственно трафика к ней прикрутить можно, учёт - никак.
Ну и да - думаю, описанного в ней не будет в принципе - не та архитектура системы.
Ну собственно если подняться по ветке выше:
> Вот это была бы вещь.Не будет это да. Но хотелки то есть на подобные вещи.
Рад, что 3 года назад выбрал именно ZabbiX.
Авторам - спасибо.
а уход внутрь себя mysql из-за взаимных блокировок запросов вылечили
сорри, это был вопрос а не утверждение. уход внутрь себя mysql из-за взаимных блокировок запросов вылечили?
C NetXMS-ом кто-нибудь сравнивал?
А у него есть встроенные инструменты отправки уведомлений на e-mail, jabber и SMS через usb модем.
А у него есть встроенные инструменты отправки уведомлений на e-mail, jabber и SMS через usb модем ?
> А у него есть встроенные инструменты отправки уведомлений на e-mail, jabber и
> SMS через usb модем ?Даже если их нет - скрипты пишутся в два счёта, и присобачиваются штатными средствами. Мыло точно есть, жабер вроде тоже.
есть все.
кто знает как в dashboard'е при срабатывании триггера показывать значение item'а?
(типа как в нагиосе в разделе problems в последней колонке отображается причина).
а то в заббиксе есть только упоминание о проблеме, а чтобы узнать подробнее что за проблема надо раз 5 кликнуть мышкой, что после нагиоса кажется весьма неудобным
Это проще во вкладке Overview сделать...
А они запилили наконец перезагрузку графиков без перезагрузки страницы?