Картинка

БЛОГ про

все цікаве у світі телекомунікацій

Так, цьому можна запобігати. Великі аварії в ЦОДах за останні роки

2021-07-15
Автор: Телесфера

Як відомо, значення дата-центрів для всіх типів компаній і звичайних користувачів неухильно зростає. При цьому лише одна хвилина простою великого ЦОД може спровокувати мільйонні збитки для клієнтів оператора. Ми вже не говоримо про збитки від багатогодинних і багатоденних простоїв. Однак аварії в ЦОДах продовжують регулярно відбуватися, і вони зовсім не обов'язково пов'язані з пожежею - за даними Uptime Institute пожежі трапляються рідше ніж раз на рік. Ми розглянемо найбільші аварії в дата-центрах за останній час і проаналізуємо їх причини.

Найгучніша аварія - пожежа в одному з дата-центрів одного з найбільших європейських хостинг-провайдерів OVH в березні 2021 року. Там загорілася система безперебійного живлення з внутрішнім порядковим номером UPS7, яка незадовго до цього пройшла технічне обслуговування, в ході якого в системі замінили безліч компонентів. І хоча після повторного запуску робота системи була штатною, пожежа все одно відбулася. Наслідки: майже повністю знищений дата-центр, а 3,6 млн веб-сайтів зіткнулися з перебоями в роботі.

Проведена після аварії експертиза показала, що у пожежі могли бути додаткові причини. По-перше, баштовий тип конструкції дата-центру, в якому застосовується конвекційна схема охолодження. «Вежа» в центрі будівлі, призначена для виведення теплого повітря, стала шляхом поширення для вогню, який швидко розійшовся по об'єкту. І це баштовий тип конструкції, який ми в цілому вважаємо надійним. По-друге, відсутність в згорілому дата-центрі системи надраннього виявлення пожежі, а також газового і водяного пожежогасіння. Для забезпечення безпеки на об'єкті були встановлені тільки димові датчики і вогнегасники. Притому що на ринку представлені тисячі продуктів безпеки для ЦОД.

Назвемо хоча б датчик моніторингу навколишнього середовища Eaton EMP002, який відстежує температуру і вологість і здійснює моніторинг роботи парних пристроїв, наприклад, датчиків задимленості і детектора відкритих дверей. Крім цього існують сучасні системи безпеки, які здатні розпізнавати зміну температури в якісь долі градусу. Коли виникає проблема, такі пристрої посилають повідомлення оператору служби техпідтримки і включають тривожний сигнал.

Інший серйозний випадок - пожежа в дата-центрі Ogden американської компанії WebNX в квітні 2021 року. Ситуацію спровокувало відключення міського електропостачання. У дата-центрі включилися автономні енергогенератори, один з яких виявився несправним і загорівся. Пожежа поширилася на кілька прилеглих приміщень, енергопостачання дата-центру повністю припинилося на кілька годин. В результаті кілька найбільш сильно обгорілих серверів не підлягають відновленню, плюс велика кількість обладнання постраждало від води, якою гасили пожежу. Відновлення роботи систем зайняло близько 20 годин, і збитки оператора перевищили $ 25 млн. До речі кажучи, в цьому дата-центрі розміщувалися і сервери компанії Gorilla Servers. Хоча їх власне обладнання не постраждало, через відключення електроенергії тривалий час не працювали сервіси та сайти їх клієнтів.

Ще один великий інцидент стався у вересні 2018 року в британському банку TSB. Банк запланував велику міграцію IT-обладнання. Однак перед міграцією їх постачальник IT-послуг Sabis не протестував один з порушених дата-центрів, приховавши цей факт від керівництва. В результаті близько двох мільйонів клієнтів банку на якийсь час втратили доступ до своїх рахунків. На усунення наслідків аварії банку довелося витратити $ 480 млн., і ще $ 35 млн. - на розслідуванні аварії.

У серпні 2020 року відбулася пожежа в центрі обробки даних телекомунікаційної компанії Telstra в Лондоні. Повідомляється, що пожежа торкнулася простору загальною площею близько 11 тис. кв. метрів, через що довелося знеструмити 1 800 серверних стійок. На щастя, ніхто з персоналу не постраждав, а серйозно пошкоджена була лише невелика частина складського приміщення. Однак загальні збитки компанії перевищили $ 10 млн - не рахуючи репутаційних втрат. За непідтвердженими даними, причиною пожежі знову став несправний ДБЖ.

Також в серпні 2020 року відбувся інцидент в дата-центрі Equinix LD8. Коли в ЦОДі позаштатно відключилася мережева електроенергія, один з ДБЖ відмовив і знеструмив головний кластер маршрутизаторів Juniper MX і Cisco LNS, який забезпечував роботу більшої частини обладнання дата-центру. Хоча співробітники підтримки відразу ж виявили проблему, її рішення зайняло кілька годин, протягом яких не працювали сервіси ряду великих компаній-клієнтів Equinix: EX Networks, Fast2Host, Epsilon, SiPalto, ICUK.net і Evoke Telecom.

У якості підсумку скажемо, що аварії різних масштабів відбуваються в дата-центрах досить часто. При цьому несправні ДБЖ, відключення електроживлення, людський фактор - всі ці (і навіть складніші) загрози можна компенсувати своєчасним встановленням обладнання для безпеки. 

 https://habr.com/ru/company/eaton/blog/567774/


Про компанію Телесфера Інтеграція.

Телесфера Інтеграція заснована в 2012 році та являється інтегратором новітніх технологічних рішень для бізнесу.  Ми розробляємо рішення, що роблять Ваш бізнес успішним.

Основні напрямки роботи компанії:

  • Побудова локальних обчислювальних мереж;
  • Налаштування мережевого обладнання передових виробників (Cisco Systems, Aruba Networks та інших);
  • Продаж телекомунікаційного обладнання;
  • Аудит локальних обчислювальних мереж;

e-mail: office@telesphera.net
Телефон: (093) 198-11-82

КОММЕНТАРІ ДО СТАТТІ

Мікрофілія EdgeConnect від Aruba покликана спростити віддалену роботу в мережі

Мікрофілія EdgeConnect від Aruba покликана спростити віддалену роботу в мережі
Aruba Networks,Налаштування,Налаштування Aruba,новини,Продуктивність

Компанія Aruba Networks, дочірня компанія Hewlett Packard Enterprise (HPE), анонсувала нову пропозицію під назвою EdgeConnect Microbranch, призначену для спрощення складної мережевої роботи вдома для підприємств. COVID-19 змусив підприємства змінити спосіб використання своїх мереж, оскільки їм доводилося підтримувати зростання кількості користувачів та пристроїв, що підключаються з віддалених місць.

Тенденції ІБ: платформений підхід, аналітика та NaaS

Тенденції ІБ: платформений підхід, аналітика та NaaS
Cisco,cisco,cisco безпека,Налаштування Cisco,новини

Cisco розповіла, як захистити хмарних користувачів, чим корисний "інженерний хаос" і чого чекати від 2022 року. 20 грудня компанія Cisco організувала для журналістів онлайн-брифінг, присвячений підсумкам 2021 та перспективам 2022 року. Сisco регулярно проводить опитування замовників та на основі отриманих результатів готує аналітичні матеріали. Нещодавно компанія випустила два нові великі звіти: Security Outcomes Study Volume 2 і 2021 Global Networking Trends. У першому аналізується те, що відбувалося протягом 2021 року в області ІБ, другий описує глобальні тренди у мережах.

CISCO – Mikrotik — FLEXVPN

CISCO – Mikrotik — FLEXVPN
Cisco,Cisco Network,cisco,Блог Телесфера,Налаштування Cisco,Продуктивність

У даній документації розглядається приклад робочої конфігурації з'єднання роутера CISCO з роутером Mikrotik через тунель GRE з IPSec шифруванням в транспортному режимі. У побудові IPsec буде використовуватися IKEv2 та аутентифікація за PSK. Усередині тунелю буде піднято протокол динамічної маршрутизації OSPF для обміну маршрутами про мережі, що знаходяться за peer-ами.