На рынке представлено большое количество приводов различной скорости от разных производителей.
Не все четко понимают, какой диск лучше купить и для каких задач, почему иногда лучше заплатить больше и когда можно сэкономить.
В этой статье я постараюсь разъяснить основные моменты и упростить проблему выбора.
Статья будет полезна не только тем, кто хочет купить/арендовать выделенный сервер, но и тем, кто хочет получить надежное хранилище информации у себя дома.
После прочтения материала станет понятно, почему не всегда целесообразно арендовать настольные решения в недорогих дата-центрах и лучше остановить свой выбор на более надежном серверном оборудовании.
Начнем с того, что все имеющиеся на рынке накопители можно четко разделить на классы: — диски для обычных настольных компьютеров (используются в домашних ПК, ноутбуках и настольных серверах недорогих дата-центров); — серверные приводы со скоростью 7200 оборотов в минуту (об/мин); — Enterprise диски со скоростью 10 000 и 15 000 об/мин; - твердотельные накопители.
Особенности выбора твердотельных накопителей мы, вероятно, рассмотрим в отдельной статье, но сейчас мы сосредоточимся в первую очередь на жестких дисках и рассмотрим, какой диск уместно использовать, где и когда.
Начнем с обычных ПК-дисков.
Это отличные накопители с достаточно большой емкостью и хорошей производительностью, но их главный недостаток в том, что они не предназначены для работы в RAID-массиве из-за особенностей конструкции.
В этих дисках вибрации, вызванные вращением шпинделя, практически никак не компенсируются.
Конечно, эти вибрации минимальны и если вы используете дома 1-2 диска, то они не являются проблемой.
Однако если рассматривать серверный случай, когда дисков много, влияние вибраций может быть весьма существенным, поскольку возникают взаимные вибрации и резонанс усиливает эффект. Так, при установке в корпус сразу 12 дисков и достаточно мощных серверных вентиляторов, работающих со скоростью 5000-9000 об/мин, уровень вибраций возрастает довольно существенно, а вместе с ними и процент ошибок и потерь, что негативно сказывается на производительности.
.
Производительность дисков настольного типа в этих случаях существенно падает, так как они испытывают значительные трудности с позиционированием головок и теряют дорожки.
Это хорошо видно на популярном графике зависимости производительности от вибрационной нагрузки:
Другое дело — диски SATA RE (RAID Edition) или серверные диски со скоростью 7200 об/мин.
Они менее подвержены вибрациям и менее зависимы от них.
Как видно из графика, вероятность появления ошибки из-за вибраций у них на 50% ниже.
Но проблема не только вибрации, другая серьезная проблема всех накопителей — это уровень неисправимых ошибок.
Что это значит на практике? Для SATA-дисков ПК уровень неисправимых ошибок составляет 1 ошибка на 10. 14 бит или 1 ошибка на 12,5 ТБ данных.
Диск емкостью 1 ТБ имеет 1000/12500x10 14 кусочек.
5 дисков имеют емкость 5x(1000/12500x10 14 ) бит, а вероятность ошибки при работе этих дисков в массиве RAID5 составит (5x(1000/12500x10 14 ))/10 14 х100% = 40%.
Как видите, использовать 5 дисков ПК в RAID5 просто невозможно, так как вероятность возникновения неисправимой ошибки при ребилде очень велика и ребилд, скорее всего, завершится неудачно.
Таким образом мы получим массив, который в случае ребилда обязательно выйдет из строя и данные будут потеряны.
Раньше я не знал об этой особенности, а в 2008 году, когда я собирал свой первый сервер из дисков ПК, я построил RAID5-массив в целях экономии дискового пространства и денег, и менее чем через месяц данные были потеряны.
.
Теперь для меня удивительно, что массив просуществовал так долго :) Конечно, мы можем использовать более надежные уровни RAID, например RAID10 или, в крайнем случае, RAID6, но при большом количестве дисков мы также будем иметь достаточно высокую степень вероятности возникновения неисправимой ошибки при ребилде.
Другое дело — серверные диски со скоростью 7200 оборотов в минуту (RPM) SATA RE или Near Line (NL) SAS. Вероятность неисправимой ошибки у них на порядок меньше в силу их технических особенностей; 1 ошибка происходит из 10 15 бит данных.
Однако при использовании не только большого количества накопителей, но и накопителей большой емкости этого может быть уже недостаточно и в таких случаях все равно придется использовать диски SAS Enterprise класса, надежность которых составляет 1 неисправимая ошибка из 10. 16 бит данных.
Также стоит отметить, что на самом деле для дисков SATA RE, Near Line (NL) SAS и дисков SAS Enterprise-класса, по сути, дисков, способных эффективно взаимодействовать с RAID-контроллером, вероятность возникновения неисправимой ошибки даже намного меньше, сразу после учета этой способности.
Таким образом, при работе с нагруженным массивом (базами данных, с которыми одновременно работает множество пользователей, активная запись и чтение данных) начинают играть роль уже исправимые ошибки, с которыми обычные диски работают неэффективно.
Задачу пытаются перечитать много раз — в том же Western Digital установлено значение 64 прохода головы с разными параметрами высоты и угла, только после чего голова переходит к обработке других задач.
Из-за этого сильно увеличивается время ожидания, чего RAID не терпит и обязательно посчитает диск потерянным и попытается восстановить диск, в результате чего нагрузка на массив станет критической, так как перестроение также будет происходить одновременно с рабочая нагрузка.
Результат предсказуем – обвал всего массива.
Диски, умеющие работать с RAID, могут сообщить RAID-контроллеру, что возникла проблема с чтением блока данных, запросить этот блок у других дисков и обработать в это время другие запросы, а получив блок, перезаписать его в другом месте проблемного диска.
Благодаря этому не происходит падения производительности RAID-массива и существенно снижается вероятность потери данных.
Однако следует отметить, что не все программные рейд-контроллеры, установленные на чипсетах, могут «понимать» такие диски, поэтому иногда для надежного массива наличия RE-дисков недостаточно, но все равно необходимо использовать аппаратный контроллер или другую платформу, которая корректно работает с RAID. Однако если вы хотите построить более надежное хранилище, чем хранилище на дисках ПК, вы можете купить более дешевые диски, чем RE-диски, например Constellation CS, которые предназначены для работы исключительно с программными рейдами и не имеют недостатка настольных (попытки перечитывать несколько раз).
данные в ущерб другим задачам), при этом они, конечно, не полноценно взаимодействуют с контроллерами, поэтому сбои RAID полностью не исключены.
Независимо от того, какой тип накопителя вы используете, также следует помнить, что накопители имеют кэш – 32, 64 МБ и более.
Что это означает для RAID-массива? С точки зрения производительности кэш — это плюс, как для чтения, так и для записи.
Однако с точки зрения надежности записи это минус.
Используя кеш, рейд-контроллер будет думать, что он уже записал данные в массив, но на самом деле они могут находиться только в кеше и записаться на диск позже.
В зависимости от размера массива растет и размер общего кэша, а в случае с 12 дисками кэш составляет уже почти гигабайт. Что произойдет с данными, если отключить питание? Верно.
Они будут потеряны.
И если мы говорим о файловом хранилище, то это, наверное, не так критично, но если мы говорим о базах данных, то будет весело.
Поэтому рекомендуется отключать кэш записи для особо важных данных, например баз данных.
Это снизит производительность диска на 8-15% в режиме базы данных, но значительно повысит надежность.
По этой причине, если вы приобретаете хранилище данных большой емкости, крупные производители по умолчанию отключают там кэш и включить его невозможно.
При использовании дисков в серверах, особенно в недорогом дата-центре, где питание сервера не является избыточным, нужно помнить об этом риске и учитывать его.
Также отметим еще одну ключевую особенность дисков SAS Enterprise-класса: данные на них хранятся еще надежнее, поскольку минимальный размер кластера составляет 520 байт, а не 512, с добавлением дополнительных 8 байт для проверки четности.
Большое количество алгоритмов восстановления данных используется без участия контроллера.
Именно по этой причине объем этих дисков не очень велик.
Кстати, по поводу объема, крайняя рекомендация: если у вас стоит задача надежного хранения данных, не пытайтесь использовать диски большей емкости, чем необходимо, так как в случае ребилда восстановление займет больше времени.
Как правило, контроллеры не анализируют, сколько реально занято на диске, и восстанавливают весь диск целиком, поэтому разница во времени восстановления между накопителем емкостью 1 ТБ и 6 ТБ будет более чем в 6 раз.
Подведем итоги.
Исходя из вышеизложенного, понятно, что для небольшого RAID-массива использование самых дорогих дисков Enterprise класса не важно и не дает никаких преимуществ в надежности.
Однако использование серверных дисков крайне желательно, так как в этом варианте на порядок выше вероятность успешного завершения ребилда.
Не следует использовать диски большего размера, чем необходимо, если только вам не требуется более высокая производительность операций ввода-вывода в секунду (некоторые более крупные диски все же могут выиграть от большего количества головок и пластин).
В тех случаях, когда необходим большой объем и много дисков и при этом достаточный уровень надежности, можно обратить внимание на SAS NL, которые по сути представляют собой модифицированную версию накопителей SATA RE за счет интерфейса SAS, но при этом имеют тот же интерфейс.
7200 об/мин.
Для повышения уровня надежности целесообразно использовать RAID более высокого уровня.
Когда размер массива не критичен и требуется максимальная надежность, вам обязательно стоит использовать SAS 15000 RPM Enterprise. Теперь при выборе аренды сервера в Нидерландах на нашем сайте Switch, с помощью конфигуратора, расположенного внизу страницы.
http://www.ua-hosting.company/servers или изменив одно из специальных предложений.
предложения:
Приходит понимание, какие диски и какой сервер лучше использовать и для каких задач, когда лучше использовать диски в RAID, а когда отдельно, раздавая файлы с ПО в зависимости от популярности (скрипт балансировщика в зависимости от нагрузки).
Почему 4 диска большего размера могут быть лучше по надежности, чем 12 меньших, но хуже по времени восстановления в случае ребилда? Ну и самое главное, почему наше предложение действительно крутое для серверного сегмента и мы действительно приблизили цену к десктопным платформам, сохранив без преувеличения на порядок более высокую надежность! Так что если вам или вашим друзьям нужен хороший сервер - добро пожаловать, продажа некоторых конфигураций из списка ниже ограничена, совсем скоро цены на эти конфигурации будут выше, хотя мы щедры, мы не безграничны :):
Да, если у кого-то есть реальный опыт использования тех или иных накопителей для определенных задач, смело делитесь им в комментариях.
Интересно всё, вплоть до статистики отказов.
Материал на эту тему, как и по вопросу выбора SSD-накопителя, мы постараемся опубликовать позже.
Теги: #Анализ и проектирование систем #raid edition #sas Enterprise #pc-drives
-
Резкое Падение Стоимости Hd-Телевизоров
19 Oct, 24 -
Йод В Природе
19 Oct, 24 -
Реальна Ли Угроза Шпионского По?
19 Oct, 24 -
Виброрезонансный Синтез Звука
19 Oct, 24 -
Сеть В Законе
19 Oct, 24 -
Nosql Субд Marklogic – Краткий Обзор
19 Oct, 24