Представлено типовое решение, предлагаемое компанией РИШОН, по созданию системы мониторинга инженерного оборудования серверной комнаты. В проекте используются средства стандарта GSM и SMS-сообщения. Описывается оборудование и ПО, используемое в подобных проектах.
Сегодня, когда развитие информационных технологий затрагивает все большее количество сфер жизни и деятельности человека, вопрос о создании надежной информационной структуры представляется более чем актуальным. Выход из строя отдельных информационных систем может привести не только к банальным простоям рабочих групп и снижению темпов производительности отдельных подразделений, но и к серьезным финансовым последствиям, затрагивающим интересы не одной тысячи людей.

Например, сбой в работе банковской системы способен парализовать деятельность как тысяч частных вкладчиков, так и сотен крупных компаний.
На практике аварийные ситуации, как правило, являются следствием несвоевременного обнаружения неисправностей, либо несвоевременного проведения профилактических работ. Таким образом, прежде чем ситуация становится критической, проходит некоторое количество времени. Этого времени может оказаться вполне достаточно, чтобы своевременно принять меры и избежать более серьезных последствий. Для этого необходимо иметь инструменты, обеспечивающие своевременное получение текущей информации о состоянии объекта и оборудования, расположенного в пределах контролируемого объекта. В последнее время именно эти обстоятельства обращают на себя все большее внимание ИТ специалистов, перемещая акценты с вопросов о создании самих информационных систем (ИС) в сторону вопросов, относящихся к поддержанию необходимого уровня надежности и работоспобности ИС, своевременного обнаружения нештатных ситуаций.
Рассмотрим возможности и преимущества системы мониторинга серверной комнаты на примере одного проекта. Он был реализован и сдан в эксплуатацию в одном из вновь построенных офисных зданий г. Москвы в 2003 году. В начале 2004 года проект был модернизирован с целью увеличения функциональности системы в целом. Вся реализация системы мониторинга заняла не более 8-и недель, включая закупку оборудования (около 2-ух недель).
В помещении, используемом в качестве серверной комнаты, для обеспечения нормальных режимов работы большого количества серверного, сетевого и коммутационного оборудования были установлены следующие системы:
прецизионный кондиционер производства Libert-Hirros (2 ед.);
источник бесперебойного питания емкостью 1200 KWA Libert-Hirros (1 ед.);
кабельная система контроля протечки воды Raychem (1 ед.);
система раннего дымообнаружения SecuriRAS (1 ед.);
система газового пожаротушения, ESA (1ед.).
Для обеспечения большей степени надежности, на случай если выйдут из строя датчики, входящие в состав кондиционеров, в помещении серверной комнаты были установлены два совмещенных датчика температуры/влажности фирмы Honeywell.
Все указанное оборудование в той или иной степени обеспечивает:
требуемые условия эксплуатации серверного и сетевого оборудования;
своевременное обнаружение аварийных ситуаций.
Назначение оборудования
Прецизионные кондиционеры — обеспечение рабочих климатических параметров (температура, влажность).
Источник бесперебойного питания — обеспечивает работу серверов при сбоях в общих сетях электроснабжения.
Кабельная система контроля протечек воды была установлена по периметру помещения на случай возможного затопления. Данная система имеет гораздо более высокую степень надежности по сравнению с системами, чьи решения базируются на использовании отдельных точечных датчиков. Принцип работы следующий. По периметру помещения прокладывается специальный кабель, который подключен к интеллектуальному модулю. При попадании воды на кабель информация о месте возникновения протечки (с указанием метра кабеля) передается на станцию мониторинга.
Система раннего дымообнаружения имеет свои особенности: под потолком смонтирована разветвленная сеть трубок, через отверстия которых принудительно засасывается воздух из помещения. Состав воздуха анализируется с помощью двух высоконадежных пожарных извещателей на предмет содержания дыма. Блок детекторов обнаруживает любые изменения анализируемого воздушного потока. Такая система способна обнаружить задымление на гораздо более ранней стадии, чем привычные датчики охранных систем.
Система газового пожаротушения обеспечивает тушение возгорания с применением газа, не причиняющего вреда оборудованию.
Совмещенные датчики температуры/влажности фирмы Honeywell контролируют параметры в центре помещения, в то время как кондиционеры расположены по краям помещения. Такое расположение оборудования позволяет практически моментально определить изменение температуры и влажности в помещении.
Система мониторинга создавалась с целью обеспечения круглосуточного удаленного контроля за состоянием оборудования, расположенного в серверной комнате, в отсутствии постоянно дежурившего оператора.
Это стало возможным благодаря использованию решений на базе GSM технологий. Уведомление ответственных специалистов осуществляется с помощью рассылки тревожных SMS-сообщений через сеть стандарта GSM на сотовые телефоны специалистов. SMS-сообщения рассылаются каждый раз при возникновении каких-либо сбоев в оборудовании, переходе оборудования в нештатный режим работы или превышении критических климатических параметров в помещении.
Доступ в серверную комнату строго ограничен и возможен только для службы ИТ заказчика. Такая практика распространена для большинства компаний, ведь именно в серверных комнатах находится одно из самых ценных достояний любой компании — информация. Эти обстоятельства накладывают определенные ограничения при рассмотрении вопросов о реализации механизмов мониторинга за состоянием не только самих серверов, но того оборудования, которое отвечает за работоспособность и безопасность серверов. И если первая задача вполне стандартна для служб ИТ, то обеспечение мониторинга инженерного оборудования выходит за рамки специализации ИТ подразделений.
К описываемой системе изначально предъявлялось повышенное внимание. В данном случае, потери от остановки серверного оборудования в результате ложной тревоги могли превышать потери от повреждения оборудования в случае возникновения пожара.
Система мониторинга
Первоначально планировалось решить задачу рассылки тревожных SMS-сообщений с помощью специальных устройств, поставляемых дополнительно с каждой единицей оборудования, мониторинг которого требовался. В ходе предварительной проработки вопроса, в данной концепции были выявлены два основных недостатка:
не все оборудование могло комплектоваться собственными GSM-модулями;
наличие в системе нескольких GSM-модулей от различных производителей усложняло разработку проекта и дальнейшее обслуживание системы.
Для реализации стоявшей задачи требовалось ПО, которое, во-первых, поддерживает функцию рассылки SMS-сообщений по заданным условиям, во-вторых, имеет встроенные интерфейсы для связи с оборудованием различных производителей. Для реализации системы мониторинга была выбрана SCADA-система — Трейс Моуд. Данный продукт зарекомендовал себя как надежный и функциональный. Эта одна из немногих SCADA-систем, позволяющих обеспечить удаленный мониторинг через сеть стандарта GSM.
В качестве аппаратного обеспечения было выбрано оборудование фирмы ICP DAS. Данное оборудование полностью отвечает требованиям разработанной системы мониторинга. Оно легко интегрируется с ПО Трейс Моуд. Имеет невысокую стоимость. Габариты модулей обеспечили их монтаж в относительно небольшом шкафу автоматики, который вписался в интерьер современного офиса, не нарушив его. В качестве GSM-модема был выбран модем Siemens Т35.
Эксплуатацией всего оборудования, расположенного в помещении серверной комнаты, и системы мониторинга занимаются специалисты клиента из отдела IT. Диспетчерская станция расположена в соседнем с серверной комнатой помещении, где непосредственно расположен отдел IT.
На экране диспетчерской станции осуществляется отображение текущего состояния каждого из устройств. В случае возникновения любой из заданных тревог, соответствующая информация отображается на экране монитора, с записью в отчет тревог.
Операторский интерфейс разработан таким образом, чтобы он был интуитивно понятен и тем людям, которые впервые его увидят. Например, при поступлении сигнала тревоги от кабельной системы контроля протечки воды на экране монитора высвечивается местоположение протечки с указанием метра кабеля, где произошла протечка. Место протечки на экране монитора обозначается красным мигающим индикатором на схеме помещения. Аналогичным образом выведена информация о других устройствах. С помощью дополнительного ПО Трейс Моуд реализована функция, обеспечивающая вывод отчетов о происходящих событиях на принтер с указанием названия оборудования, где произошла тревога, описанием тревоги и временем ее фиксации. Когда устройство возвращается в нормальный режим работы, формируется аналогичный отчет.
Как упоминалось ранее, постоянно дежурившего оператора не предусмотрено. Оповещение о происходящем осуществляется, в основном, с помощью рассылки SMS-сообщений, которые формируются при наступлении заданных событий и отправляются на телефоны шести специалистам при помощи ПО Трейс Моуд GSM Activator. АРМ в данном случае играет второстепенную роль и, как правило, используется для детализации информации, поступившей на телефоны специалистов.
Рассылка сообщений происходит при:
включении тревоги на устройстве;
выключении устройства либо работе в нештатном режиме;
смене режима работы устройства;
обрыве связи с устройством;
отсутствии питания на устройстве;
возврате в нормальный режим работы.
Общее число контролируемых сигналов в системе — ок. 100. Часть оборудования была подключена к станции через модули ввода/вывода ICP DAS. Связь с кондиционерами, кабельной системой протечки воды и источником бесперебойного питания осуществляется по протоколу ModBus. Связать все устройства с ПО Трейс Моуд удалось достаточно быстро. Некоторые затруднения возникли при подключении оборудования, работающего по протоколу ModBus, и связаны были с особенностью работы данного оборудования. Для разрешения сложившейся ситуации в FBD программе были реализованы алгоритмы обработки поступающего сигнала.
В результате внедрения описанной выше системы мониторинга удалось обеспечить своевременное оповещение специалистов о происходящих сбоях оборудования, расположенного в серверной комнате. Уже на стадии отладки были своевременно обнаружены:
утечка фреона у одного из прецизионных кондиционеров;
протечка скопившегося в кондиционере конденсата.
Оперативно поступившая информация не позволила допустить выход из строя оборудования, стоимость которого существенно превышает стоимость внедренной системы мониторинга.
На протяжении первых месяцев работы система мониторинга заработала себе репутацию надежной и простой в эксплуатации. Сегодня специалисты службы ИТ всегда точно знают, что происходит с вверенным им оборудованием, в том числе в те часы, когда офис закрыт и нет возможности подойти и оценить текущую обстановку. Внедренная система мониторинга позволяет оперативно принимать решения о необходимости вмешательства персонала и обеспечивает более надежную работу всей информационной системы предприятия.
Стоимость решения
Как и любое другое техническое решение, данная система мониторинга имеет определенную степень индивидуальности и потому не представляется возможным заочно определить точную стоимость подобных решений для других объектов. Тем не менее, стоимость подобных решений вполне сопоставима со стоимостью 2–3 серверов среднего уровня.