Технология Dell Reliable Memory Technology Pro: Обнаружение И Изоляция Ошибок Памяти

Независимо от производителя и типа оперативной памяти, практически вся компьютерная память содержит те или иные микродефекты.

Производитель памяти может потратить от 10 до 15% стоимости модуля памяти DIMM на тщательное тестирование ошибок, но память все равно может быть подвержена сбоям и сбоям во время работы системы.

К ошибкам памяти могут привести самые разные факторы – от чрезмерного нагрева до «старения» и наличия в ней микродефектов.



Технология Dell Reliable Memory Technology PRO: обнаружение и изоляция ошибок памяти

В действительности частота ошибок динамической оперативной памяти (DRAM) на порядки выше, чем сообщается.

В недавнем крупномасштабном исследовании ошибок памяти DRAM в полевых условиях, основанном на данных, собранных за более чем два года, около трети всех машин и более 8% модулей DIMM испытывали по крайней мере одну исправимую ошибку в год ( Ошибки DRAM в природе: крупномасштабное полевое исследование ).

На некоторых платформах почти 50% систем столкнулись с устранимыми ошибками (отчет IBID), и в среднем только около 1,3% систем столкнулись с фатальными ошибками, а для некоторых платформ этот показатель составлял 2-4%.

В стандартных офисных ПК ошибки памяти редко оказывают негативное влияние на производительность стандартного прикладного программного обеспечения.

Однако в высокопроизводительных системах с интенсивными вычислениями в сфере финансов, разведки нефти и газа, медицинской визуализации, производства мультимедиа (рендеринг и редактирование) и т. д. целостность данных является критически важным компонентом общей архитектуры системы.

В этих высокопроизводительных системах замена памяти занимает первое место в списке ремонтов из-за неисправных компонентов, при этом ошибки памяти являются одной из наиболее распространенных аппаратных проблем, которые могут вызвать сбои системы (отчет IBID).



Технология Dell Reliable Memory Technology PRO: обнаружение и изоляция ошибок памяти

Поэтому способность обнаруживать, сообщать и предотвращать сбои ошибок DIMM на высокопроизводительных рабочих станциях становится необходимостью.

Учитывая высокий спрос на экстремальную производительность памяти, компания Dell запатентовала инновационную эксклюзивную технологию, применяемую в рабочих станциях Dell Precision, которая помогает выявлять и удалять неиспользуемую память.

Эта уникальная функция Dell помогает сократить время простоя системы, упростить работу службы ИТ-поддержки и снизить общие затраты на обслуживание, одновременно увеличивая срок службы памяти и повышая производительность пользователей.

Давайте рассмотрим основные концепции технологии Dell Reliable Memory Technology PRO (RMT PRO), некоторые основные причины ошибок памяти и то, как RMT PRO помогает устранить эти ошибки.



БАРАН

Благодаря новым достижениям в области процессорных технологий, увеличению скорости шины и усовершенствованию общей архитектуры компьютерные системы становятся более сложными, и оперативная память также должна идти в ногу с этими изменениями.



Технология Dell Reliable Memory Technology PRO: обнаружение и изоляция ошибок памяти

По сути (очень упрощенно), микросхемы DRAM представляют собой массив элементов состояния «включено/выключено», которые поддерживают это состояние (1 или 0) при наличии питания.

При отключении питания они возвращаются в нулевое состояние.

Несколько микросхем собраны вместе в подсистему памяти и размещены на печатной плате — модуле DIMM (двухрядный модуль памяти).

Большинство рабочих станций, таких как Dell Precision, используют тип DIMM, известный как DDR4 SDRAM, синхронное динамическое запоминающее устройство с произвольным доступом.

По сути, по сравнению с более ранними версиями типов памяти (такими как DDR3), DDR4 быстрее, имеет более высокую пропускную способность и более высокую плотность памяти и требует меньшего напряжения питания.



Ошибки памяти

Ошибки памяти могут быть вызваны большим количеством факторов, приводящих к автоматическому переходу одного бита DRAM в противоположное состояние (например, из 1 в 0, хотя он должен оставаться в 1 в течение этого цикла памяти).

На ошибки могут влиять такие факторы, как перегрев, возраст памяти, дефекты и т. д. Исследования показали, что в первые 10 месяцев эксплуатации DIMM частота ошибок резко возрастает. Ошибки такого типа называются исправимыми: они случайным образом повреждают биты, но не оставляют физических повреждений и могут быть исправлены путем обновления состояния памяти.

Однако во многих случаях возникают неисправимые ошибки.

Это повторяющаяся битовая ошибка, возникающая из-за физического дефекта или другой аномалии в модуле DIMM или одновременного возникновения двух ошибок в одном и том же блоке памяти.

Неустранимая ошибка памяти может привести к сбою системы (требующей перезагрузки) или приложения (код стоп-ошибки системного уровня, дамп ядра или синий экран смерти — BSoD).

Часто исправимые ошибки предупреждают о предстоящих неисправимых ошибках.

В исследованиях около 65-80% неисправимых ошибок предшествовала исправимая ошибка в том же месяце.



Обработка ошибок

Сегодня многие ПК класса рабочих станций оснащены алгоритмами четности памяти, которые, проще говоря, гарантируют, что каждый раз, когда считывается байт данных, отправленные данные совпадают с полученными данными.



Технология Dell Reliable Memory Technology PRO: обнаружение и изоляция ошибок памяти

Более сложные системы используют другие методы исправления и обнаружения ошибок.

Наиболее распространенным вариантом является память с кодом исправления ошибок (ECC).

Он используется в серверах и рабочих станциях, таких как рабочие станции Dell Precision. По сути, память ECC включает в себя дополнительные биты и встроенный контроллер памяти, который проверяет четность памяти, и в случае однобитовой ошибки логика памяти ECC может исправить ошибку и вывести исправленные данные для поддержания системы.

бег.

ECC превосходно исправляет отдельные ошибки памяти и обеспечивает стабильность системы.

Однако память ECC не обеспечивает решение нескольких ошибок в одном блоке памяти.

В этих случаях произойдет повреждение данных.

В такой ситуации может помочь технология Dell Reliable Memory Technology PRO.

Преимущества технологии РМТ ПРО

Если пластина жесткого диска физически повреждена, плохой сектор будет помечен системой ПК как непригодный для использования.

Однако на большинстве компьютеров, включая рабочие станции с памятью ECC, неисправимая ошибка или несколько исправимых ошибок в одном блоке памяти модуля DIMM могут привести к сбою системы.

Пользователь, как правило, вынужден сообщить о такой ошибке в свою службу поддержки, которая, в свою очередь, должна запустить какую-то диагностическую программу для обнаружения ошибки.

Часто из-за одного сбоя может потребоваться замена всего модуля DIMM. Результатом является увеличение времени простоя, снижение производительности, потеря времени ИТ-персонала, необходимость замены модулей DIMM и возможное повреждение ключевых файлов приложений.



Технология Dell Reliable Memory Technology PRO: обнаружение и изоляция ошибок памяти

На помощь приходит технология Dell Reliable Memory Technology PRO (RMT PRO).

По своей концепции RMT PRO аналогичен технологии исправления ошибок жесткого диска.

Она обнаруживает неисправимые ошибки и многоразрядные исправимые ошибки в модуле DIMM и исправляет проблему.

Вместо дорогостоящего простоя, запуска диагностики, открытия системы и замены неисправного модуля DIMM, технология RMT PRO при перезагрузке:

  • Отмечает неисправную часть отдельного модуля DIMM.
  • Сообщает о дефекте и местонахождении неисправного раздела DIMM в биосе.

  • Удаляет эти поврежденные ячейки и небольшое количество соседних ячеек из пула используемой системной памяти.



Технология Dell Reliable Memory Technology PRO: обнаружение и изоляция ошибок памяти

После простой перезагрузки рабочей станции РМТ ПРО делает дефектную область невидимой для операционной системы.

Приложения и критически важные функции системы будут обходить отмеченную область и продолжать работать без необходимости замены оборудования.

Все будет так, как будто плохой памяти никогда и не было.

Это обеспечивает бесперебойную работу и снижает количество сбоев системы и ошибок приложений.

RMT PRO позволяет снизить затраты на оборудование – модули памяти.

Поскольку память может ухудшиться при интенсивном использовании или чрезмерном нагревании (обычно из-за высокой нагрузки), физические ошибки могут увеличиться.

Несмотря на «плохую память», информация остается на DIMM. Кроме того, если необходимо заменить модуль DIMM, RMT PRO отобразит в BIOS, какие модули DIMM вызывают ошибки, что ускоряет устранение неполадок и замену модулей DIMM, помогая сократить время простоя и снизить общие затраты на обслуживание.

Таким образом, технология RMT PRO увеличивает жизненный цикл оперативной памяти и помогает экономить деньги.



Технология Dell Reliable Memory Technology PRO: обнаружение и изоляция ошибок памяти



выводы

Хотя некоторые схемы обнаружения ошибок, такие как память ECC, могут обнаруживать ошибки памяти, многие из этих алгоритмов могут обрабатывать только исправимые ошибки.

При возникновении физических дефектов или неисправимых ошибок в модулях DIMM Dell RMT PRO обеспечивает дополнительный уровень обнаружения и исправления неисправной памяти.

Сопоставляя и удаляя поврежденные сектора, RMT PRO гарантирует, что приложения с интенсивными вычислениями получают доступ только к полезной памяти.

Это может привести к значительной экономии времени и денег за счет сокращения времени замены оборудования и модулей DIMM, а также сокращения времени простоя оборудования.

Когда целостность данных имеет решающее значение, технология RMT PRO дает вам необходимое спокойствие, предоставляя доступную память для максимизации производительности и надежности рабочей станции.

Теги: #Компьютерное оборудование #Dell #RAM #DRAM #Настольные компьютеры #память #RAM #обработка ошибок #RAM #DIMM #dell rmt pro

Вместе с данным постом часто просматривают:

Автор Статьи


Зарегистрирован: 2019-12-10 15:07:06
Баллов опыта: 0
Всего постов на сайте: 0
Всего комментарий на сайте: 0
Dima Manisha

Dima Manisha

Эксперт Wmlog. Профессиональный веб-мастер, SEO-специалист, дизайнер, маркетолог и интернет-предприниматель.