Хабрахабр

Мониторинг ИБП. Часть вторая – автоматизируем аналитику

Некоторое время назад я наваял систему для оценки жизнеспособности офисных UPS. Оценка основана на долгосрочном мониторинге. По результатам использования систему допилил и узнал много интересного, о чём и расскажу – добро пожаловать под кат.
Первая часть

Из разового запроса к UPS можно узнать разве только, что жизнь – боль. В целом задумка оказалась верной. Часть параметров имеет отношение к реальности только без подключённых 220 В, некоторые по результатам анализа оказываются откровенным бредом, какие-то нужно пересчитывать руками, сверяясь с реальностью.

Ну не руками же считать, в самом деле, автоматизаторы мы или что. Забегая вперёд, эти нюансы в систему я постарался добавить.

Как одиночное значение он сообщает ничего и обычно равен 100. Вот, например, параметр "заряд батареи в процентах". Удивительно, но часть этой работы ИБП делает сам, однако по очень странным формулам; об этом ниже. Что действительно важно: как быстро батарея разряжается, как быстро заряжается, сколько раз была разряжена до критических значений.

Но если смотреть на него в динамике, оказывается, что иногда там бред, а иногда — интересные сведения о подключённом оборудовании. Параметр "нагрузка на ИБП" весьма хорош и полезен.

Практически Грааль, если бы не одно но: абсолютное большинство времени батарея находится на заряде, и в параметре отображается вольтаж заряда, а не батареи. "Вольтаж батареи". Погодите, а этим не должна заниматься процедура self-test?..

Должна, только её результаты выводятся никуда. "Self-test". Плюс не все ИБП сообщают о самом факте состоявшегося self-test. При неудачном self-test ИБП отключится и заорёт как резаный, это единственный доступный результат.

Он призван предсказать, сколько продержится батарея при имеющейся нагрузке. И «nice try vendor» – самый интересный из имеющихся параметр "battery runtime". Фактически же он показывает розовые мечты, особенно в состоянии полного заряда. Также на него завязана внутренняя логика поведения ИБП.

Нашлись и нюансы организационного характера.

При этом записать эти данные (после замены батареи, соответственно) мне удалось только в изделия от APC, и то танцуя с бубном. Например, все попавшиеся мне ИБП имеют данные о дате батареи (аж два поля). Записи оно тоже не подлежит. В Powercom же эти сведения не впихнуть никак, по крайней мере, под Windows.
Тот же Powercom отличился одинаковыми значениями в поле «serial number».

По факту battery runtime можно смело делить на 2, а то и на 3. Калькуляция "battery runtime", похоже, включает в себя значения из тех периодов, когда к ИБП подключены 220 В, и, соответственно, данные о батарее откровенно неверны. Кроме того, оно основано на «battery load», за которым тоже замечены странности: на некоторых экземплярах оно долго не сбрасывается после высокой нагрузки, а на других – стремится к нулю. И при этом оно всё равно останется сугубо синтетическим значением.

А значит, можно не просто глядеть на данные (и уж тем более просматривать вручную все имеющиеся записи), но сразу загонять весь массив в анализатор и строить на их основании рекомендации. Несмотря на такой зоопарк, можно увидеть, что все параметры по-прежнему поддаются некоторой алгоритмитизации. Что и было реализовано в новой версии ПО.

Страница сведений об ИБП выдаст предупреждения и рекомендации:

  • зарегистрирован хотя бы один провал self-test (если ИБП предоставляет такой функционал)
  • необходимость заменить батарею
  • необычные значения нагрузки на ИБП
  • отсутствие данных о батарее
  • необычные значения входного напряжения
  • рекомендации по использованию данных и обслуживанию ИБП

(все возможные варианты можно найти в ups_additional.php)
Необходимым условием для корректной аналитики, конечно, является максимально возможный сбор данных.

На главной странице можно сразу увидеть максимальные и критические значения и откорректированное предсказание времени работы.

А ещё:

  • теперь корректно считается максимальное время потери питания
  • актуальная информация с ИБП обозначается зелёным цветом, устаревшая – серым, критическая красным и оранжевым
  • добавлен процедура оптимизации базы данных (запускается вручную, с автоматическим созданием бэкапа)
  • убрана бесполезная информация с главного экрана и добавлена полезная 🙂

image

image

Практически вся установка вручную. Disclaimer:
Конечно, это совсем не энтепрайз. Тем не менее, пользуюсь с пользой и вам желаю.
github.com/automatize-it/NUT_UPS_monitoring_webserver_for_Windows Тестов было маловато, кое-где выскакивают ошибки.

Спасибо за внимание!

Теги
Показать больше

Похожие статьи

Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *

Кнопка «Наверх»
Закрыть