Top.Mail.Ru
Обсудить проект Обсудить проект

Система мониторинга Zabbix – бережет нервы, повышает эффективность

zabbix.png

Мы занимаемся поддержкой клиентов в различных областях IT-сферы

Это и сетевая инфраструктура, различное серверное оборудование и сетевые сервисы

«Вообще ничего не работает!»

В таком «расширяющемся зоопарке» постоянно что-то происходит. Как правило, о том, что у клиента что-то случилось, наши специалисты узнают от самого же разгневанного клиента. Он не может куда-то подключиться, у него перестал работать Интернет или «вообще ничего не работает!!!». Редко в штате компании есть админ, который может внятно объяснить, что в данный момент происходит у клиента. Чаще всего нашему специалисту приходится получать информацию у далекого от IT-специфики человека. И человек этот нервничает и каждый свой ответ сопровождает напоминанием о том, как важно решить проблему «прямо сейчас, как можно быстрее, немедленно!»


Решение

Подобные ситуации подтолкнули нас к мысли о необходимости внедрения систем мониторинга. Такая система сама собирает необходимую информацию и сообщает о возникающих проблемах нашим специалистам до того, как о них узнает сам клиент. Мы проанализировали рынок и в итоге наш выбор пал на Были прослушаны курсы, получены сертификаты и, главное, необходимые знания для того, чтобы эту систему внедрять и использовать!


Пример внедрения

На тот момент у нас был клиент, у которого происходили непонятные «подвисания» на терминальном сервере. В какой-то момент сервер перестает принимать RDP-подключения и в итоге помогает только перезагрузка. Причем перезапускать приходилось локально, так как подключиться удаленно к нему на тот момент было уже невозможно. В логах сервера не было никаких подозрительных записей, которые бы помогли диагностировать проблему. Вот и приходилось на него периодически подключаться и наблюдать за его состоянием, но никак не удавалось выловить, в какой именно момент и из-за чего происходит подвисание. Поэтому и было решено именно с этого клиента.

На сервер клиента был установлен zabbix_agent который и принялся бодро собирать информацию о загруженности памяти, процессора, дисков. Так как там был развернут PostgreSQL, поэтому собиралась информация и о его состоянии. И вот спустя несколько дней пришло сообщение от что сервер Postgres завершил свою работу.

Попытка подключиться к серверу для выяснения причины остановки базы не удалась. Созвонившись с клиентом стало понятно, что никто не может подключиться к серверу. Причем клиент удивился, как это мы узнали, что у них проблемы с сервером, если они нам еще не сообщали. В это время продолжал получать информацию от агента, установленного на этом сервере, поэтому быстро выяснилось, что серверу не хватает свободной памяти. Пока сервер перезагружался, была поднята статистика использования памяти этим сервером за предыдущий период в несколько дней.

На графике использования памяти было явно видно, как с каждым днем уменьшалась свободная память как в период простоя сервера, так и под нагрузкой. Пока свободная память не кончилась окончательно. Далее было делом техники найти, что же явилось причиной утечки памяти. После устранения причины график выглядел уже совсем наоборот (в положительном смысле).

С тех пор сервер работал в штатном режиме без перезагрузок.

С он уже несколько раз успел серьезно помочь при диагностике и устранении различного рода проблем у клиентов. В нескольких случаях удалось это проделать еще до того, как клиент к нам обратился. А некоторые клиенты даже не подозревают, что у них были устранены проблемы, которые в будущем могли привести к временной остановке их бизнес-процессов.

Удобно группировать различные объекты наблюдения в так называемые экраны, которые позволяют одновременно видеть динамику изменений по ним.

Масштабируемость и гибкость позволяет решать очень многие задачи. И под каждую задачу мы можем найти свои способы контроля и доделать шаблоны мониторинга.

Кроме того, положительно сказывается на спокойствии клиента и на скорости работы нашего специалиста.

Если прочтение данной статьи сподвигло вашу компанию на обращайтесь к нам, настроим мониторинг вашей инфраструктуры так, как нужно вам!

Поделитесь,
если вам было интересно:
Подберем для вас оптимальное решение
Обсудить проект Обсудить проект