При построении конфигурации высокой доступности на базе оборудования платформы RISC мы выбираем из очень ограниченного набора кластерного программного обеспечения.
Прежде всего, это вендорские разработки — Oracle Solaris Cluster, PowerHA (IBM), Serviceguard (HP), а также Veritas Cluster Server. Последнее решение по сути является основным вариантом, предлагаемым на данный момент для построения кластерных конфигураций, причем для разных платформ — Oracle, IBM и т.д. Однако мы решили не ограничиваться этими разработками и поискать альтернативное кластерное решение для x86. Таким образом, был инициирован внутренний проект по тестированию конфигурации кластера на базе программного обеспечения Pacemaker. Pacemaker — это продукт с открытым исходным кодом, включенный во многие дистрибутивы Linux. Продукт поддерживает широкий спектр топологий кластера, различные стратегии кворума, определение порядка запуска и зависимостей между приложениями, параллельные приложения и т.д. Не имеет программы лицензирования; следовательно, лицензии приобретать не нужно; при этом решение может поддерживаться рядом вендоров, например, Red Hat. Основной целью проекта было развитие и расширение спектра предлагаемых нами продуктов и технологий для кластеризации и построения конфигурации высокой доступности, создавая более доступную альтернативу существующим решениям.
Мы поставили перед собой следующие задачи:
- проводить стендап-демонстрации типовых конфигураций, изучать функционал и ограничения решения, отрабатывать конфигурации, получать навыки внедрения и настройки;
- определить возможность и перспективы дальнейшего продвижения решений в наших проектах.
Во-первых, конфигурации должны обеспечивать реализацию основных функций, гарантирующих высокую доступность сервисов.
Должна быть обеспечена защита от основных видов аппаратных и программных сбоев: сбой сервера (аппаратного обеспечения, ОС), сбой подключения к дисковым ресурсам, сбой подключения к локальной сети, сбой службы приложений.
Проверка выполнения функций осуществлялась в соответствии с PMI. Второй критерий заключается в том, что тестируемый продукт должен быть выгоден с коммерческой точки зрения по сравнению с Veritas Cluster Server. Третье — наличие дополнительного функционала продукта, такого как удобный графический интерфейс, инструменты мониторинга и оповещения.
Мы подготовили испытательный стенд, общая схема которого представлена на рис.
1. Рис.
1. Схема испытательного стенда
Для обеспечения целостности конфигурации каждый узел кластера имеет 2 соединения в межкластерной сети связи.
Кроме того, для повышения доступности узлов кластера каждый узел имеет дублирующее подключение к сегменту публичной сети, предназначенному для передачи данных приложений.
Конфигурация кластера была построена для экземпляра СУБД Oracle 11g2. Для резервирования системы использовалась схема 1+1. Он подразумевает использование однотипного оборудования и возможность передать функционал одного из серверов в случае его выхода из строя на резервный узел.
Принципиальная схема решения представлена на рис.
2. Рис.
2. Схема решения
Распределение ресурсов кластера между вычислительными узлами показано на рис.
3. Рис.
3. Настройка распределения ресурсов кластера между вычислительными узлами.
Группа oracle-grp включает следующие ресурсы:
- res-IP-public — IP-адрес из публичной сети (агент IPaddr2)
- res-ora_dg — ресурс управления дисковой подсистемой (агент LVM)
- res-ora_FS – ресурс управления файловой системой (агент файловой системы)
- res-oracle – экземпляр СУБД Oracle
- res-oralsnr — экземпляр прослушивателя Oracle
- res-ping — ресурс проверки сетевого подключения (агент ping в конфигурации клона)
- scsi-shooter — агент фехтования
На момент тестирования поддерживаемыми версиями СУБД Oracle для создания отказоустойчивых конфигураций на базе ПО Pacemaker были Oracle Database 10g и 11g. Как уже говорилось выше, тестирование проводилось с СУБД Oracle Database 11g2. База данных Oracle 12c не поддерживается.
Приготовленный раствор подвергся полному циклу испытаний.
Основные из них и результаты испытаний представлены в табл.
1. Таблица 1. Цикл испытаний и результаты
Нет. | Требования для проверки | Результат испытаний |
Методика проверки программного кластера Кардиостимулятор | ||
1. | Проверка состава и конфигурации аппаратного и программного обеспечения | Сделанный |
2. | Проверка резервирования сетевого подключения к публичной сети | Сделанный |
3. | Проверка резервирования SAN | Сделанный |
4. | Проверка доступности СУБД | Сделанный |
5. | Подключение к консоли управления кластером | Сделанный |
6. | Проверка состояния ресурсов кластера | Сделанный |
7. | Проверка состояния узлов кластера | Сделанный |
8. | Проверка состава кластера | Сделанный |
9. | Проверка статуса пульса | Сделанный |
10. | Проверка статуса ограждения ввода-вывода | Сделанный |
11. | Проверка доступности сервиса (Kernel Panic основного узла кластера) | Сделанный |
12. | Проверка доступности сервиса (отключение всех Ethernet-соединений основного узла кластера) | Сделанный |
13. | Проверка доступности сервиса (отключение всех FC-подключений к основному узлу кластера) | Сделанный |
14. | Проверка доступности сервисов (завершение процесса, управляемого программным обеспечением кластера) | Сделанный |
15. | Проверка доступности сервиса (сброс с помощью ILO основного узла кластера) | Сделанный |
16. | Проверка работы механизмов отказоустойчивости (отключение основного узла кластера от одной межкластерной сети связи) | Сделанный |
17. | Проверка работы механизмов отказоустойчивости (отключение основного узла кластера от всех сетей межкластерной связи) | Сделанный |
18. | Регулярная миграция сервисов на резервный узел | Сделанный |
выводы
Конфигурация высокой доступности на базе ПО Pacemaker отвечает основным требованиям отказоустойчивости и может быть альтернативой VCS в продуктивных приложениях с учетом следующих ограничений:- резервирование Ethernet-адаптеров (обработка ситуации сбоя физического соединения) должно обеспечиваться с помощью стороннего программного обеспечения и использования в конфигурации дополнительного «пинг-агента», который настроен на периодическую проверку доступности указанных целей в сети путем Айпи адрес;
- вы должны использовать последнюю версию программного обеспечения кластера;
- Поддержка решения поставщиком ограничивается базовым программным обеспечением.
Другие агенты написаны Сообществом или вручную.
Эти агенты не поддерживаются поставщиком.
- улучшенная документация;
- увеличение количества ресурсов в кластере до 100;
- разработка интеграции с контейнерами;
- разработка интеграции с RedHat 7.x.
- отказ от дальнейшей разработки решения на базе cman & rgmanger
Возможность создания конфигураций DR: построение полноценных DR-решений на базе ПО Pacemaker невозможно.
Поддерживаемое решение — «растянутая» конфигурация кластера с репликацией с использованием DRBD. Нет встроенной интеграции с механизмами репликации от производителей систем хранения.
Основными отличительными особенностями программного обеспечения Pacemaker являются:
- отсутствие лицензионной программы, т.е.
затраты на лицензию;
- интеграция кластерного ПО с системными службами Linux;
- Открытый исходный код.
- ограничение на количество узлов в кластере – максимум 16;
- приложение только на платформе Linux;
- небольшое количество агентов;
- нефункциональный графический интерфейс;
- отсутствие функции аварийного восстановления;
- низкая гибкость конфигурации;
- нестабильность работы некоторых версий ПО (ошибки ПО);
- отсутствие возможности управлять несколькими кластерами из единой графической консоли управления;
- сложность в настройке и эксплуатации;
- отсутствие сводного комплекта документации.
По этим показателям Pacemaker уступает Veritas. Однако для случаев, когда цена является решающим фактором, возможно использование программного обеспечения Pacemaker с учетом описанных выше нюансов и ограничений.
Статью подготовил Антон Голощапов, инженер-конструктор компьютерных систем компании «Инфосистемы Джет».
Теги: #*nix #Виртуализация #Администрирование серверов #Администрирование баз данных #высокая доступность #информационные системы реактивных самолетов #информационные системы реактивных самолетов #информационные системы реактивных самолетов #информационные системы реактивных самолетов #информационные системы реактивных самолетов #информационные системы реактивных самолетов #информационные системы реактивных самолетов #информационные системы реактивных самолетов #jet информационные системы #информационные системы реактивный #информационные системы реактивный #инфосистемы реактивный #инфосистемы реактивный #инфосистемы реактивный #инфосистемы реактивный #инфосистемы реактивного #инфосистемы реактивного # инфосистемы джет #инфосистемы джет #инфосистемы джет #инфосистемы джет #инфосистемы джет #инфосистемы джет #кардиостимулятор #кластерный сервер veritas
-
Проблема С Диапазоном Видео Тв/Пк
19 Oct, 24 -
Пришел Ли «Китайский Интернет» В Россию?
19 Oct, 24