Простои дата-центра (время, когда система не работает) не только наносят финансовый ущерб, но и вредят репутации бренда.
Множество причин могут вызвать простои в центрах обработки данных.
Бывает, что инфраструктура не справляется с нагрузкой из-за различных дефектов (стихийные бедствия, перебои в центральной электросети и т. д.).
Но именно человеческий фактор является причиной большинства ошибок, которые приводят к снижению безопасности и надежности дата-центра.
По данным статистики WinMagic, опросившей около тысячи операторов дата-центров, большинство респондентов (31%) считают наиболее серьезной угрозой логической безопасности сотрудников, имеющих доступ к серверным фермам.
Интересно, что хакерские атаки занимают лишь второе место (30%).
Компания Google согласилась возместить своим клиентам до 25 % их ежемесячных затрат за сбой в работе облака Google Compute Engine, продолжавшийся почти 20 минут (учитывая, что аптайм 99,9 % допускает недоступность сервиса не более 45 минут).
в месяц).
Согласно пресс-релизу, который был размещен на веб-ресурсе Google Cloud Platform, основной причиной сбоя стали изменения в конфигурации сети.
Когда операторы начали вносить изменения, программное обеспечение управления конфигурацией обнаружило конфликт. Пытаясь исправить ситуацию, система попыталась вернуться к предыдущей конфигурации и обнаружила ранее неизвестную ошибку, приведшую к сбою.
Каким-то образом «залатать» дыру удалось только через 20 минут, но проблема так и осталась нерешенной.
Разработчикам Google пришлось немало поработать над оптимизацией своих систем.
Похожая история произошла в дата-центре австралийской телекоммуникационной компании Telstra. Тот самый пресловутый человеческий фактор вывел из строя весь дата-центр.
Но в отличие от Google, Telstra потребовалось почти четыре часа, чтобы устранить проблемы.
Мобильная сеть телекоммуникационной компании отключилась.
Как сообщает Sydney Morning Herald, инцидент произошел из-за действий инженера, который отключил неисправный сетевой узел, не активировав предварительно резервный узел.
Эти действия вызвали перебои в работе мобильной сети и оставили многих клиентов без связи.
Проблема затронула многие австралийские города, включая Брисбен, Сидней, Мельбурн, Аделаиду и Перт. Во время исправления тысячи людей выразили недовольство работой компании в социальных сетях.
После инцидента произошло еще несколько, менее серьезных и длительных простоев.
Руководство компании решило компенсировать клиентам причиненные неудобства.
Telstra подарила своим абонентам день бесплатного безлимитного мобильного интернета (Free Data Day).
По итогам дня было скачано 2686 ТБ данных, что закономерно привело к перегрузке сети и снижению скорости загрузки.
Простои дата-центров наносят финансовый ущерб и вредят репутации компании.
Поэтому так важно операторам, проектировщикам и строителям дата-центров сделать все возможное, чтобы минимизировать время простоя.
Конечно, никто не может гарантировать 100% безопасность, но если использовать современные стандарты, подготовить план действий на случай непредвиденных ситуаций и не забывать о своевременном обслуживании, риск простоя будет сведен к минимуму.
Теги: #Google #дата-центр #ИТ-компании #ИТ-компании #dts #несчастные случаи #outhiring #telstra
-
Реальность Успешного Веб-Сайта Сегодня
19 Oct, 24 -
Подарить Ручку-Накопитель
19 Oct, 24 -
Настольные Игры В Жанре Фэнтези.
19 Oct, 24 -
Стереогарнитура Bluetooth От Dajet.
19 Oct, 24 -
Создание Двухсторонней Доски (Видео)
19 Oct, 24