Будни дата-центра: хитрость с «Газелью», капризы оттепели и нежданные гости

Будни дата-центра: хитрость с «Газелью», капризы оттепели и нежданные гости

Команда Т1 Облако продолжает серию публикаций о нетривиальных буднях инженеров современных дата-центров. Жизнь серверных залов наполнена не только монотонным гулом вентиляторов, но и событиями, которые порой напоминают сценарии приключенческих фильмов. В этом выпуске мы расскажем о том, как смекалка помогала бороться с капризами техники, а природные стихии и неожиданное соседство превращали рутинную эксплуатацию в настоящую проверку на прочность.

История о «реанимации» электропитания и синем тракторе

Мобильный генератор на базе старого авто

На заре 2010-х мне довелось работать в региональной ИТ-компании. На тот момент мы были скорее амбициозным стартапом, чем зрелым оператором: наши серверные мощности располагались в подвальных помещениях административных зданий. Главной проблемой была организация надежного резервного электропитания. Источники бесперебойного питания (ИБП) обеспечивали лишь краткосрочную автономию, а подвести вторую независимую линию питания удавалось далеко не везде.

Решение родилось на стыке инженерной мысли и жесткой экономии: мы приобрели подержанную «Газель», установили в её кузов мощную дизель-генераторную установку и подготовили точки подключения на всех площадках. План казался безупречным: при аварии спецтранспорт оперативно прибывает на место и восстанавливает подачу энергии.

Однако суровая реальность внесла свои коррективы. Выбранный из соображений бюджетности автомобиль оказался в плачевном состоянии. Когда на одной из удаленных площадок произошло серьезное отключение, наш «мобильный резерв» преподнес сюрприз: двери заклинило, а аккумулятор полностью разрядился за месяцы простоя. В разгар кризиса на помощь пришел случай — мимо проезжал коммунальный трактор. За небольшое вознаграждение тракторист согласился отбуксировать наш «энергоблок». Проблема заключалась в заблокированном руле: мне пришлось на ходу разбирать рулевую колонку отверткой, чтобы направить машину в нужную сторону под аккомпанемент непрерывных звонков от недовольных клиентов. Удивительно, но сам генератор запустился мгновенно, и связь была спасена. Этот случай стал уроком: надежность системы определяется её слабейшим звеном.

Борьба с затоплением: инженерная интуиция против стихии

Затопление в серверной

Зимние оттепели — традиционное испытание для подземных коммуникаций. Однажды, в конце моей смены, поступил тревожный звонок от арендаторов соседнего помещения: уровень воды в подвале стремительно рос. Ситуация в машинном зале оказалась критической: вода уже подбиралась к электрическим щитам и нижним секциям стоек. Риск поражения током был огромен.

Передвигаясь по импровизированным «кочкам» из перевернутых ведер, я добрался до эпицентра. Зрелище было удручающим: искрящая проводка, воющие аварийные сигналы ИБП. К счастью, один из новых модулей бесперебойного питания был установлен на верхнем ярусе и продолжал функционировать. Удалось оперативно перекоммутировать критически важное оборудование, исключив контакт поврежденных узлов с водой.

Мы вступили в схватку со стихией, вычерпывая воду вручную, пока не прибыл мощный промышленный насос. Оказалось, что источником проблем стал общий подвал здания с неисправными коммуникациями. С тех пор автоматическая система откачки воды стала обязательным атрибутом этой площадки, предотвратив еще не одно потенциальное затопление.

Акустический удар: когда тишина стоит дорого

Последствия срабатывания системы пожаротушения

Системы газового пожаротушения (например, на основе газа Novec) считаются самыми безопасными для оборудования. Однако даже они могут стать причиной катастрофы при нарушении регламента проверок. Во время планового тестирования системы подрядчики использовали стандартную схему: физическое отключение баллонов и подключение контрольной лампы для проверки сигнала.

Роковую роль сыграл сбой в радиосвязи. Один инженер неверно интерпретировал команду коллеги и активировал систему, когда баллоны еще были подключены к магистрали. Газ, выходящий под колоссальным давлением, создал мощнейшую акустическую волну. Последствия были разрушительными: от звукового давления деформировались двери, треснула штукатурка, а большинство жестких дисков в серверах мгновенно вышли из строя. Инженер, находившийся в зале, получил серьезную контузию.

Этот инцидент заставил нас полностью пересмотреть требования к безопасности: теперь все системы газового пожаротушения в наших дата-центрах оснащаются специальными глушителями, нивелирующими разрушительную силу звука при выбросе газа.

Нелегальное казино и штурм спецназа

Необычное соседство ЦОД

Иногда угроза стабильности ЦОД исходит не от техники, а от соседей. В одном из наших зданий, где располагался узел связи и компактный машинный зал, подвальное помещение занял арендатор, организовавший там подпольное казино. О существовании «логова азарта» мы даже не догадывались, пока одной ночью на объект не нагрянул спецназ.

Ночной дежурный был в шоке, увидев в камерах наблюдения вооруженных людей в бронежилетах, мирно беседующих в коридоре нашего дата-центра. Оказалось, что оперативники блокировали все выходы, включая грузовой лифт, ведущий из нашего помещения прямо в подвал. Организаторы казино пытались пробить бетонный пол ломом, чтобы уйти через канализацию, но потерпели фиаско. Для нас эта история закончилась благополучно, но она наглядно показала, как важно знать, кто находится за стенкой вашего критического объекта.

Испытание «на прочность» для иностранных гостей

Проверка систем безопасности

Проверка дата-центра крупным международным заказчиком — это всегда экзамен на соответствие высочайшим стандартам. Делегация от известного китайского вендора скрупулезно изучала каждый аспект: от запасов топлива для ДГУ до алгоритмов работы пожарной автоматики. Однако финальным аккордом стала демонстрация системы физической безопасности.

Начальник службы охраны, человек «старой закалки», решил доказать эффективность мониторинга периметра максимально наглядно. Прямо в присутствии иностранных топ-менеджеров он приказал дежурному охраннику через рацию… штурмовать забор объекта. Иностранные коллеги с изумлением наблюдали на мониторах, как «нарушитель» пытается преодолеть ограждение, и мгновенно срабатывает тревожная сигнализация, а группа быстрого реагирования блокирует сектор. Такая «натурная» проверка произвела на вендора неизгладимое впечатление и сняла все вопросы о качестве охраны.


Эксплуатация ЦОД — это постоянный баланс между строгими регламентами и умением находить выход из нестандартных ситуаций. А какие необычные случаи происходили в вашей практике? Делитесь своими историями в комментариях!

 

Источник

Читайте также