Технологии Повышения Отказоустойчивости Vps

Недавно мы решили выйти за рамки сегмента бюджетных серверов: пересмотреть свое видение хостинга виртуальных машин и создать максимально отказоустойчивый сервис.

В этой статье я расскажу вам, как устроена наша стандартная VPS-платформа и какие приемы мы использовали для ее улучшения.

Наша стандартная технология создания VDS Сейчас наш хостинг виртуальных серверов выглядит так: В стойках размещены одноюнитовые серверы примерно следующей конфигурации:

Процессор — 2 процессора Intel Xeon E5-2630 v2 @ 2,60 ГГц
Материнская плата: Intel Corporation S2600JF
Оперативная память: 64 ГБ
ДИСК: 2 x HGST HDN724040ALE640/4000 ГБ, INTEL SSDSC2BP480G4 480 ГБ

Один из серверов является основным.

На нем установлен VMmanager и к нему подключены узлы — дополнительные серверы.

Помимо VMmanager, на основном сервере располагаются клиентские виртуальные серверы.

Каждый сервер «смотрит» на мир через свой сетевой интерфейс.

А для увеличения скорости миграции VDS между узлами серверы соединяются между собой отдельными интерфейсами.

Технологии повышения отказоустойчивости VPS

(Рис.

1. Текущая схема размещения виртуального сервера) Все серверы работают независимо друг от друга, и в случае проблем с производительностью на одном из серверов все виртуальные серверы можно разделить (функция «Миграция» в VMmanager) на соседние узлы, либо перенести на вновь добавленный узел.

Ситуации, когда сервер выходит из строя (паника ядра, вышедшие из строя диски, отключенный блок питания и т. д.), приводят к недоступности клиентских виртуальных машин.

Разумеется, система мониторинга сразу же оповещает о проблеме ответственных специалистов, и они начинают определять причины и устранять аварию.

В 90% случаев замена вышедших из строя компонентов занимает не более часа, плюс время требуется на устранение последствий аварийного отключения сервера (синхронизация системы хранения, ошибки файловой системы и т.п.

Все это, конечно, неприятно для нас и наших клиентов, но простая схема позволяет избежать ненужных расходов и удерживать цены на низком уровне.

Новое облачное VDS Чтобы удовлетворить самых требовательных клиентов, для которых важна работоспособность сервера, мы создали сервис с максимально возможной надежностью.

Итак, нам понадобилось новое программное обеспечение и оборудование.

Так как мы уже работаем с продукцией компании ISPсистема , логичным шагом было присмотреться к VMmanager-Cloud. Эта панель создана специально для решения проблемы отказоустойчивости; на данный момент оно хорошо развито и достигло определенной стабильности.

Нас это устроило и альтернативы мы не рассматривали.

Безоговорочно принята в качестве распределенной файловой системы.

Цеф .

Он бесплатный, свободно развивающийся, гибкий и масштабируемый.

Мы пробовали другие системы хранения, но Ceph оказался единственным продуктом, который полностью удовлетворял нашим требованиям к хранению.

Поначалу это казалось сложным, но после некоторых попыток мы наконец разобрались.

И они не пожалели об этом.

Узлы нового кластера собраны на том же оборудовании, что и рабочий кластер VMmanager, но с небольшими изменениями: Мы перешли на мультиноды с резервированием питания.

Для переключения между узлами кластера вместо обычного гигабитного соединения мы использовали Infiniband. Позволяет увеличить скорость соединения до 56Gb (IB-карты Mellanox Technologies MT27500 Family ConnectX-3, коммутатор - Mellanox SX6012) В качестве операционной системы для узлов кластера был выбран дистрибутив CentOS 7. Однако, чтобы все вышеперечисленное работало вместе, мне пришлось собрать собственное ядро, пересобрать qemu и запросить некоторые модификации в VMmanager-Cloud.

Технологии повышения отказоустойчивости VPS

(Рис.

2. Новая схема облачного хостинга виртуальных серверов) Преимущества использования новой технологии В результате мы получили следующее:

еще более профессиональная услуга виртуального сервера с высоким временем безотказной работы.
Его стабильность не зависит от проблем с аппаратной частью узлов кластера.
повышение надежности хранения данных за счет распределенной файловой системы с хранением нескольких копий.
быстрая миграция виртуальных машин.
Перенос работающего VPS с узла на узел происходит практически мгновенно без потери пакетов и пингов.
При необходимости это быстро освобождает агрегат для обслуживания.
При сбое узла клиентские виртуальные машины автоматически запускаются на других узлах.
Для клиента это выглядит как внеплановая перезагрузка; время простоя равно времени перезагрузки ОС.

С начала декабря прошлого года кластер работает в боевом режиме, на данный момент он обслуживает несколько сотен клиентов, за это время мы наступили на массу ошибок, разобрались с узкими местами, сделали необходимую настройку и смоделировали все аварийные ситуации.

ситуации.

Пока мы продолжаем тестирование, экономисты подсчитывают стоимость.

За счет дополнительного резервирования и использования более дорогих технологий оно получилось выше, чем у предыдущего кластера.

Мы учли это и разрабатываем новый тариф для самых требовательных клиентов.

Остается ряд рисков, которые мы никак не можем закрыть, это электроснабжение дата-центра и внешние каналы связи.

Для решения подобных задач обычно создаются географически распределенные геокластеры; возможно, это будет одно из наших следующих исследований.

Если вас интересуют технические подробности реализации описанной выше технологии, мы готовы поделиться ими в комментариях или сделать отдельную статью по итогам обсуждения.

Теги: #ceph #kvm #centos #облачное хранилище #QEMU #vps #облачный хостинг #ispsystem #vmmanager #infiniband

Технологии Повышения Отказоустойчивости Vps

Последнее изменение: 2024-10-19 21:10:22

Вместе с данным постом часто просматривают:

Технологии Повышения Отказоустойчивости Vps

Как Писать Веб-Контент, Который Продает

Демокрит

Кризис В Греции Вызвал Резкий Рост Продаж Консолей Playstation И Техники Apple На Местном Рынке

Привлеките Капитал Для Своего Бизнеса В Области Электронной Коммерции В Интернете

Бывший Генеральный Директор Twitter Дик Костоло Объявляет О Работе Над Фитнес-Стартапом

По Материалам Статьи «Кому Принадлежит Байнет»

Устройство Измерения Co2

Рэш, Реализация Fpga

Восстание Машин: Пять Офисных Рабочих Мест, Которым Угрожают Роботы

Свежий Воздух 2.0

Автор Статьи

Роман Иванов

Интересно

Bobocomm – Создатели Рекламы...

Growbydata — Программное Обеспечение Для Конкурентной Разведки...

Neolive - Программное Обеспечение Для Цифровых Вывесок...

Casey Powell Lacrosse 18 Xbox One X S Активация...

Увеличение Трафика На Выставке За Пределами Выставочного Зала...

Партнерам Нужна Надежная Маркетинговая Стратегия, Чтобы Добиться Успеха В...

Федуленков...

Dima Manisha