Білки, якорі та недопалки: найнеймовірніші причини збоїв у роботі дата-центрів

Сучасні дата-центри — надійні конструкції, які не просто вивести з ладу. Проте в маси досить часто просочується інформація про збої в роботі ЦОДів. Найпоширеніші причини простою — перебої в електроживленні, неполадки в системі охолодження, роботі мережевого обладнання, недбале ставлення до технічного обслуговування серверних ферм. Однак іноді робота дата-центрів зупиняється і з інших причин, про які не заведено розголошувати широкому загалу. Ми розглянули найкурйозніші та найбезглуздіші випадки збоїв у роботі, здавалося б, таких злагоджених систем, як ЦОДи.

  1. Зміни в часі
    Через нерівномірність обертання Землі астрономічний та атомний час розходяться на 1 секунду кожні 1000 днів. Тому стрілки годинника по всьому світу іноді підводять на 1 секунду.  Додавання секунди до атомного часу може призвести до колапсів у роботі ІТ-систем. Так сталося 2012 року, коли найбільші сайти, включно з LinkedIn, Mozillа, Reddit, The Pirate Вау, перестали працювати. В Австралії внаслідок збою в роботі дата-центрів із цієї причини понад 400 рейсів Quantas було затримано на дві години. Авіакомпанії довелося перейти на ручний режим управління.
  2. Атака білок
    Білки жують усе, що їм натрапить під ніс. Зокрема й дроти, які використовуються для передачі інформації. У 2010 році представники Yahoo повідомили про те, що білки в буквальному сенсі слова з’їли половину їхнього дата-центру в Санта-Кларі, США.
  3. Якорем по кабелю
    Про довговічність підводних комунікаційних кабелів для передачі трафіку з континента на континент ніхто не сперечається. Вони розміщені на глибині десятків тисяч метрів під водою. Проте існують випадки, коли надміцні кабелі пошкоджувалися. Наприклад, 2008 року корабель кинув якір, який потрапив у комунікаційний кабель, що негативно позначилося на роботі дата-центрів.
  4. «Кожна стіна — двері» Ральф Емерсон
    Виявляється, потрапити в деякі дата-центри не так вже й складно. Робота данського провайдера Nianet зупинилася, коли в його ЦОД проникли злодії. Вони прорізали отвори в стінах, потрапили всередину, забравши з собою коштовності у вигляді мережевих карт. Залишається сподіватися, що стіни цього сховища серверів зроблені не з гіпсокартону.
  5. Ретельно вибирайте, де викинути недопалок
    Інакше ризикуєте спровокувати зупинку дата-центру. Саме так і сталося з центром обробки даних Perth iX, який закрили протягом години після того, як спрацювала його система безпеки. Спеціальні детектори виявили дим біля будівлі дата-центру, ідентифікувавши його як палаючу клумбу в саду біля зовнішньої стіни об’єкта. Як з’ясувалося пізніше, найімовірніше, це був недопалок, недбало кинутий кимось зі співробітників ЦОДу.

Ось так завжди: поки вчені пихтять у своїх лабораторіях над новими відкриттями, у двигуни літаків потрапляють птахи, у турбіни ракет — космічний пил. Трапляються катастрофи, які часом призводять до незворотних втрат. Якраз саме час розридатися від усвідомлення недосконалості навколишнього світу, але не виходить. Мабуть, тому, що ця сама недосконалість якраз і є потужним стимулом до розвитку, прагнення до нових технологій, нових відкриттів.

За матеріалами статті Дж. Верджа «10 найдивніших причин збоїв у роботі дата-центрів»

Залишити відповідь

Дякуємо, що поділились