Год назад мировые дата-центры потребляется 2% всей электроэнергии, вырабатываемой на планете.
Аналитики прогнозируют, что к 2020 году этот показатель вырастет до 5%.
При этом примерно половина всей этой энергии тратится для охлаждения.
Именно эти затраты призваны сократить системы искусственного интеллекта.
Сегодня мы поговорим о последних событиях в этой области.
/ Фото Национальный архив (Великобритания) СС
Google Проект
В 2016 году DeepMind и Google разработал систему искусственный интеллект, который следил за отдельными компонентами дата-центра.Она предоставила администраторам дата-центров рекомендации по оптимизации энергопотребления серверов.
Решение позволило сократить энергозатраты на работу систем охлаждения на 40% и снизить коэффициент ПУ? на 15%.
По словам операторов дата-центров, подсказки машинных алгоритмов были полезны в их работе, но на их обработку уходило слишком много времени.
Вот почему Дэн Фуенффингер, один из инженеров Google, предложенный полностью передать управление системами кондиционирования на интеллектуальные решения.
Это должно было разгрузить операторов дата-центров, поскольку им останется только проводить тонкую настройку и контролировать весь процесс.
В течение следующих двух лет компания усовершенствовала свою систему искусственного интеллекта, и теперь она полностью управляет охлаждение серверных помещений.
Например, машинный алгоритм «догадался», что холодный воздух зимой сильнее охлаждает воду в чиллерах, и воспользовался этим для оптимизации энергопотребления.
Этот уменьшенный энергопотребление еще на 30%.
В Google полагают, что их разработка и ее аналоги в дальнейшем помогут владельцам дата-центров снизить стоимость систем охлаждения как минимум вдвое и сократить выбросы CO2 в атмосферу.
Как это работает
Вся система охлаждения в дата-центре компании контролируется тысячами физических датчиков.Данные от них поступают на вход системы искусственного интеллекта, развернутой в облаке.
Это нейронная сеть из пяти скрытых слоев по 50 нейронов в каждом.
Она работает с 19 различными параметрами, включая общую нагрузку на серверы, количество работающих водяных насосов, влажность наружного воздуха и даже скорость ветра.
Каждые пять минут система считывает показания датчиков (это примерно 184 тысячи выборок — 70% из них понадобилось для обучения сети, а остальные 30% использовались для перекрестная проверка ) и использует их для оптимизации значения PUE. Он строит список прогнозов о том, как то или иное изменение в системе повлияет на энергопотребление дата-центра и температуру в компьютерном зале.
Например, изменения температуры в холодных коридорах могут вызвать колебания нагрузки на охладители, теплообменники и насосы, что приведет к нелинейным изменениям в производительности оборудования.
Из составленного списка выбираются наиболее эффективные действия, которые максимально снизят энергопотребление и не приведут к сбоям в работе дата-центра.
Далее эти инструкции отправляются обратно в дата-центр, где локальная система управления еще раз проверяет, соответствуют ли они требованиям безопасности (и их выполнение не приведет к непоправимым последствиям).
Поскольку на системы искусственного интеллекта возложена часть ответственности за бесперебойную работу таких сервисов, как Google Search, Gmail и YouTube, разработчики предусмотрели ряд защитных мер.
Среди них алгоритмы расчета показателя неопределенности.
Для каждого из миллиардов возможных действий система ИИ оценивает надежность и сразу отсеивает действия с низким рейтингом (то есть с высокой вероятностью неудачи).
Еще одним методом защиты стала двухуровневая верификация.
Оптимальные действия, рассчитанные с помощью алгоритмов ML, сравниваются с набором политик безопасности, предписанных операторами центров обработки данных.
Только если все в порядке, вносятся изменения в работу систем кондиционирования.
При этом операторы всегда готовы отключить «автоматический» режим и взять управление на себя.
Подобные разработки
Google не единственная компания, разрабатывающая решения на основе машинного обучения для управления системами охлаждения центров обработки данных.Например, Litbit работает над технологией DAC для мониторинга вычислений и энергопотребления.
/ Фото Рейнермедиа СС
Для мониторинга состояния вашего ЦАП-оборудования использует Датчики Интернета вещей.
Система может «слышать» ультразвуковые частоты и «чувствовать» аномальные вибрации пола.
Анализируя эти данные, Dac определяет, правильно ли работает все оборудование.
В случае возникновения проблем система уведомляет администраторов, формирует заявку в техподдержку и даже автоматически отключает оборудование (в критической ситуации).
Аналогичное решение создано компанией Nlyte Software, которая объединенный с командой IBM Watson IoT. Их система собирает данные о температуре, влажности, потреблении электроэнергии, загрузке оборудования в дата-центре и дает инженерам советы по оптимизации рабочих процессов.
Решение работает как с облачной, так и с локальной инфраструктурой.
Внедрение систем искусственного интеллекта в дата-центрах позволит выйти за рамки обычного DCIM-решения (программные продукты для мониторинга дата-центров).
Среди экспертов IT-индустрии бытует мнение, что в скором времени большинство процессов, происходящих в дата-центре, будут автоматизированы.
В результате администраторы дата-центров смогут сконцентрироваться на других, более важных задачах, влияющих на рост и развитие компаний.
P.S. Материалы по теме из Первого блога о корпоративном IaaS:
- Почему хорошему IaaS-провайдеру не следует иметь собственный дата-центр
- Как разместить свою ИТ-инфраструктуру в облаке IaaS-провайдера и не пожалеть об этом
- Наша распаковка: блейд-сервер Cisco UCS B480 M5
-
Урановая Промышленность
19 Oct, 24 -
Windows 7 Milestone 1 Утекла В Сеть
19 Oct, 24 -
Пассивный Доход Для Студии. Поддержка Сайта.
19 Oct, 24 -
Дань Уважения Hiew
19 Oct, 24