Подходит к концу 10-летие эксплуатации небольшой серии компьютеризированных систем, спроектированных под моим руководством, и, не претендуя на обобщение выводов, тем не менее, по случаю юбилея можно сделать некоторые выводы относительно надежности системы.
эксплуатация компьютерной техники в течение длительного периода времени.
Изделие, опыт эксплуатации которого мы рассматриваем, предназначено для проведения измерений в режиме реального времени и состоит из ряда электронных модулей собственной разработки и иерархически организованной группы компьютеров: промышленной рабочей станции верхнего уровня ИСП.
типа PPC-5150 под управлением Windows, промышленный управляющий компьютер типа ICP WS -855 с одной процессорной платой Rocky-C800 под управлением DOS и встраиваемым компьютером Fastwel CPU-188 под управлением DOS. Единицей работы на объекте является группа из двух изделий, дублирующих друг друга, и групповой комплект запасных частей и принадлежностей (ЗИП).
Всего в различных населенных пунктах России имеется около 10 действующих объектов (соответственно 20 изделий или 80 компьютеров, входящих в их состав, включая запасные части).
Гарантийный срок на продукцию – 10 лет, назначенный срок службы – 20 лет. В целом эксплуатация продукции за 10 лет была успешной.
Благодаря грамотно выбранной политике резервирования (полный горячий резерв плюс априори наименее надежные блоки и модули в запчастях) не было ни одного случая невозможности использования изделия по назначению.
Можно привести основные выводы в области надежности для разработчиков компьютерных систем, полученные по результатам эксплуатации упомянутой серии и, отчасти, других продуктов.
Некоторую полезную специфику собираемой статистики, отличающую ее от более широких данных ремонтных центров, придает одинаковая аппаратная конфигурация, программное обеспечение и целевая эксплуатация изделий, установленных на различных объектах.
Итак, выводы: 1. Значительное количество отказов продукции (в нашем случае около 50%) связано с выходом из строя серийно выпускаемых компьютерных комплектующих.
Этот результат оказался для нас весьма неожиданным, поскольку мы не экономили на комплектующих и априори ожидали меньшей надежности собственного электронного оборудования из-за его меньшей развитости.
Для описанной выше серии продуктов мы получали в среднем одну жалобу на компьютерные компоненты в год. 2. Существует начальный период эксплуатации (несколько месяцев), в течение которого проявляются присущие комплектующим дефекты, не успевшие проявиться при тестировании заводом-изготовителем.
Статистика неисправностей в начальный период, по-видимому, связана с нераспознанными производственными дефектами и существенно отличается от статистики последующего периода (через год и далее), связанного с ухудшением характеристик в процессе эксплуатации.
Большинство неисправностей, выявленных в начальный период, в дальнейшем не повторяются.
3. Если комплектующие компьютера выходят из строя на втором или третьем году эксплуатации, то с большой вероятностью можно сказать, что эти же комплектующие выйдут из строя и в дальнейшем.
Отсюда можно сделать вывод, что дополнительный ремонтный парк целесообразно создавать по итогам двух-трех лет эксплуатации, пока компоненты этого типа еще не сняты с производства.
4. Такие компьютеры, как PPC-5150 и их компоненты, выходили из строя много раз, тогда как WS-855 и CPU-188 и их компоненты выходили из строя даже один раз после начального периода.
Предположительно это связано с более высокой степенью интеграции, более высокой частотой и более высокой температурой в PPC-5150. 5. Существует весьма существенная зависимость вероятности выхода из строя электронных модулей от объекта их эксплуатации.
Эту зависимость нельзя свести к человеческому фактору, поскольку за время формирования нашей выборки сменился эксплуатационный персонал на объектах, а характер статистики – нет. Предположительно, причины сводятся к качеству электропитания или климатическим условиям.
6. В компактных системных блоках производители склонны выбирать нестандартные конструктивные решения и изменять их по мере возникновения производственных потребностей.
Это приводит к тому, что, например, номинально распространенная серия ICP PPC-5150 распадается на ряд конструктивно несовместимых моделей.
Если, например, в старом PPC-5150 выйдет из строя материнская плата, то установить на ее место плату от нового PPC-5150 невозможно (по крайней мере, без лобзика и эпоксидной смолы), и придется заменять всю систему.
единица.
[Здесь может быть упоминание Apple].
7. При проектировании изделий с длительным сроком службы особое внимание необходимо уделять встроенным источникам питания (аккумуляторам), имеющим ограниченный срок службы.
В то время как стандартные батареи, такие как, скажем, CR2032 на материнской плате, можно легко заменить через несколько лет, интегрированные модули и микросборки, включающие в свою неразборную конструкцию батарею, могут столкнуться с существенными проблемами при снятии с производства.
8. Системный блок компьютера, целиком помещенный в комплект запчастей, может оказаться весьма полезным.
Эксплуатационному персоналу гораздо проще заменить весь системный блок, а затем вместе с производителем заняться локализацией неисправности, чем пытаться найти неисправную деталь на месте.
В целом практика показывает, что единственный вид ремонтных работ, который целесообразно поручить эксплуатационному персоналу, не имеющему специальной квалификации, — это замена неисправных узлов или модулей целиком.
9. Информация, записанная на DVD-R/RW, сохраняется дольше нескольких лет только при определенном везении.
Однако о долговременном архивном хранении информации лучше написать отдельную статью.
Теги: #ИТ-инфраструктура #Системное администрирование #Администрирование серверов #эксплуатация #высокая доступность #надежность #ха #высокая доступность
-
Таинственные Следопыты: Рейнклифф
19 Oct, 24 -
Технологии Dell Emc Для Защиты Данных
19 Oct, 24 -
Пользователи И Клиенты. В Чем Разница?
19 Oct, 24 -
Гаджет Для Президента: Обама И Рост Fitbit
19 Oct, 24 -
Бросьте Свинью: С Чего Все Началось. Часть 1
19 Oct, 24