Хабрахабр

Всё под контролем. Зачем нужны системы мониторинга инженерной инфраструктуры центров обработки данных

Хабр, привет!

Работаю здесь больше 20 лет. Я ведущий инженер компании «ЛАНИТ-Интеграция». Последние семь лет занимаюсь инженерным обеспечением ЦОДов: устанавливаю и запускаю оборудование в работу.

Однако этого нельзя добиться, если сосредоточиться только на резервных копиях систем и качестве отдельных элементов. С каждым годом появляется всё больше требований к надежности и удобству использования дата-центров. Если коротко, она следит за инженерной инфраструктурой ЦОД и помогает избежать аварийных ситуаций. На рынке понимают эту простую мысль, поэтому компании всё чаще внедряют единую систему мониторинга.

В статье я расскажу о готовых программно-аппаратных решениях мониторинга, которые мы с коллегами используем в проектах.

Источник
Для начала расскажу о том, из чего состоит основа центра обработки данных. Её разделяют на три составляющих.

  • Телекоммуникационная система принимает и передаёт данные между ЦОД и его пользователями, а также связывает элементы центра.
  • Техническая архитектура — это серверы доступа, серверы приложений, серверы СУБД, системы хранения данных. Она отвечает за функционирование бизнес-приложений и позволяет пользователям получить к ним доступ.
  • Инженерная инфраструктура делает так, чтобы все системы исправно работали, то есть поддерживает для них оптимальные условия.

Инженерная инфраструктура дата-центров тоже делится на две подсистемы:  функционирования и безопасности. Первая включает системы общего, гарантированного и бесперебойного электроснабжения, технологического кондиционирования, монтажные конструктивы. В подсистему безопасности входят охранно-пожарная сигнализация, системы автономного газового пожаротушения, видеонаблюдения, контроля и управления доступом.

Для уверенности, что все системы работают в штатном режиме, нужен постоянный контроль, который и даёт мониторинг.

Источник

Без него специалисты должны либо жить и трудиться всё время рядом со шкафами, либо выходить из кабинета и бежать к ним каждый раз, когда возникла какая-то проблема или есть подозрения, что она может случиться. Мониторинг помогает инженерам, обслуживающим ЦОД, комфортнее работать.

Источник

За показателями, как правило, следит дежурная смена. Мониторинг в реальном времени показывает, как работает инфраструктура ЦОД. Также система мониторинга собирает данные о параметрах, статусе оборудования, следит за сроками сервисного обслуживания, наработанными часами и т.д. При возникновении отклонения или нештатной ситуации сотрудники дежурной смены  могут вовремя предотвратить критическую ситуацию или же свести её последствия к минимуму.

Что именно контролирует система мониторинга и какие задачи решает?

  • Следит за параметрами питающей электрической сети и состояния автоматических выключателей;

  • контролирует состояния и параметры работы источников бесперебойного питания;

  • мониторит состояния и параметры работы холодильных машин, кондиционеров и вентиляционных установок;

  • собирает данные о температуре и влажности воздуха, узнаёт о наличии протечек и задымления в ЦОД;

  • создаёт отчёты и графики по требуемым параметрам;

  • отправляет уведомления о любых событиях и аварийных ситуациях;

Защита от людей

К сожалению, статистика говорит, что множество аварийных ситуаций с техникой возникает по вине человека. Именно поэтому мониторинг в том числе следит не только за параметрами, но и за теми, кто имеет доступ к ЦОД и кто/что в нем делает.

Виды систем мониторинга

Существует множество различных систем, так или иначе позволяющих контролировать параметры и работу различных типов  оборудования — мониторинг IT-систем, мониторинг СКС/ЛВС, мониторинг инженерных систем и т.д.

По типу реализации системы делятся на программные, аппаратные и гибридные решения.

По уровню контроля системы мониторинга делятся на распределенные и централизованные.

Распределенные системы позволяют отслеживать состояние одного или нескольких однотипных устройств.

Централизованные системы дают возможность объединить всё контролируемое оборудование, в том числе и несколько распределенных систем, в единую систему, позволяющую наблюдать за работой всего оборудования в «одном окне».

Источник

Из чего состоит

Уже много лет мы с коллегами работаем с системой мониторинга NetBotz и системой управления инфраструктурой ЦОД StruxureWare Data center Expert от APC by Schneider Electric. У нашей команды есть партнёрская сертификация направления DCIM.

С их помощью можно создать инженерную инфраструктуру ЦОД «под ключ» и собрать систему мониторинга «из кубиков». У большинства производителей инженерного оборудования существуют комплексные решения.

Это:

  • контроллеры мониторинга — устройства, к которым подключаются всевозможные датчики и которые собирают с этих датчиков информацию;
  • расширители портов для подключения датчиков — дополнительные блоки, которые подключаются к контроллерам мониторинга для увеличения количества подключенных датчиков;
  • датчики температуры, влажности, протечки, задымления, открытия двери, обнаружения движения, вибрации, аналоговые датчики 4-20 мА и 0-5 вольт, сухие контакты и т.п.;
  • устройства контроля и ограничения доступа как в коммуникационные шкафы, так и в помещения;
  • камеры видеонаблюдения.

Однако у готовых систем есть и минусы. Как правило, каждый производитель предлагает систему мониторинга своего оборудования, то есть того, которое производит сам. Конечно, очень удобно, когда инфраструктура ЦОД строится на оборудовании одного бренда. Внедрение такой системы занимает мало времени, нет проблемы с подключением и распознаванием параметров оборудования.

Источник

Бывает, что такие системы поддерживают некоторые типы и модели оборудования сторонних производителей, но для корректного подключения и отображения параметров очень часто требуются дополнительные действия и время. Предсказуемо, что главная проблема таких систем — это подключение оборудования сторонних производителей.

При этом нужно предоставить технические данные на подключаемое оборудование, заполнить несколько форм и подождать около месяца. Например для подключения устройств других брендов, подключаемых по протоколу MODBUS к системе Data center Expert от APC, не входящих в список поддерживаемого, приходиться обращаться в службу поддержки. Своими силами это сделать практически невозможно.

Установка и настройка

От теории к практике. Первую систему мониторинга мы установили в 2010 году. Всего мы реализовали более 15 систем мониторинга ЦОД. С одной стороны, работа каждый раз одинакова, с другой стороны, у каждого заказчика свои условия и требования, поэтому каждый проект запоминается чем-то своим. Ниже я расскажу о самых интересных проектах за последние несколько лет.

НИС ГЛОНАСС

Два центра обработки данных находились в Москве и в Санкт-Петербурге. Их связали единой системой мониторинга инженерной инфраструктуры. В этом проекте впервые пришлось разделять права пользователей для доступа к группам устройств. Как это? Специалисты из Москвы контролировали все устройства в обоих ЦОД, а специалисты в Санкт-Петербурге контролировали только свою часть оборудования.

Проект для металлургического комбината

Нашей команде впервые пришлось «прикручивать» к системе мониторинга StruxureWare Data center Expert оборудование сторонних производителей, дизель-генераторную установку, щит автоматики и щит управления системой кондиционирования. Не обошлось без помощи западных специалистов службы поддержки производителя системы мониторинга. Они за месяц написали драйверы для нужных нам устройств.

Научно-исследовательское подразделение госкорпорации

Здесь помимо стандартного решения мы впервые реализовали мониторинг щита вводного распределительного устройства с автоматическими рубильниками, управляемого программируемым реле ZelioLogic, щита распределения питания с контролем состояния автоматических выключателей на контроллере Acti-9 SmartLink и счетчиков электроэнергии PowerLogic от компании Schneider Electric.

Технопарк

Мы впервые в стране реализовывали системы мониторинга и системы управления инфраструктурой ЦОД с применением 190 беспроводных датчиков температуры и влажности, расположенными в 6 машинных залах и 4 аппаратных.

Относительно скоро стартует ещё один крупный проект. Для нас это будет новый опыт. Предстоит внедрять системы мониторинга RAMOS и систему управления инфраструктурой ЦОД Aegis DCIM (чешский производитель CONTEG). Возможно, снова появится повод, о чём вам рассказать.

Кстати, наша команда всегда ищет талантливых и увлеченных профессионалов.

Теги
Показать больше

Похожие статьи

Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *

Кнопка «Наверх»
Закрыть