Fox Mulder (fox_mulder_cp) wrote,
Fox Mulder
fox_mulder_cp

Category:

MTBF (наработка на отказ) и гарантия в мире компьютеров. Что важно?

Оригинал взят у bliznezz в MTBF (наработка на отказ) и гарантия в мире компьютеров. Что важно?
украдено с http://www.hwp.ru/articles/MTBF__28narabotka_na_otkaz_29_i_garantiya_v_mire_kompyuterov_CHto_vazhno__64037/?SHOWALL_1=1

Схематически это выглядит так. В течение года тестировалось 1000 изделий. За время теста 10 вышло из строя. Отсюда MTBF будет равно 1год х (1000шт/10шт) = 100 годам = 876580 часам (1 год = 8765.8 часов). Производитель округлит и напишет 900000 часов, потому что продавец все равно даст гарантию 2-3 года.

Разработчик – производитель – продавец – покупатель. Этот стандартный путь проходит любое устройство, будь то электронный блок для космического телескопа или ПК на вашем рабочем столе. И на каждом этапе используются результаты анализа, выполненного с помощью теории надежности.

Как известно, покупатели делятся на две принципиально разные категории: частные лица и фирмы. Корпоративный покупатель обеспечен внимательным отношением, так как он умеет не только защищаться, но и выбирать продавца с подходящей репутацией. А обычный покупатель и защищен плохо, и считать ему приходится каждый рубль. О нем и пойдет речь.

Ресурс - это не главное!
Не все вещи доживают до конца гарантии

Когда такой покупатель приходит в магазин компьютерной техники, один из главных вопросов, который его волнует – надежность устройства. Каждому хочется, чтобы его ПК устарел морально и физически, будучи в рабочем состоянии, и чтобы не пришлось через месяц после окончания гарантийного срока мучиться вопросом «что полетело?» и «во что обойдется теперь ремонт?».

Что такое MTBF, "наработка на отказ" или "ресурс"

Согласно ГОСТ 27.002-89 для оценки надежности используются следующие термины, с которыми мы сталкиваемся в магазине: «наработка на отказ» – наработка от окончания восстановления работоспособного состояния после отказа до возникновения следующего отказа. Это в случае ремонтопригодной продукции. Эквивалент в английской литературе – MTBF (Mean (operating) time between failures) – среднее время между отказами. В случае продукции не подлежащей ремонту используется термин «наработка до отказа» – наработка от начала эксплуатации до возникновения первого отказа. Эквивалент в английской литературе – MTTF (Mean (operating) time to failures) – среднее время до отказа.

Часто встречается также термин Lifetime warranty. Это, как правило, гарантия соответствия параметров изделия на все время его эксплуатации. Некоторые фирмы ограничивают гарантию каким то количеством лет (обычно не больше пяти) после прекращения выпуска данного изделия или изделия способного его заменить. Поэтому, если эти нюансы принципиальны, то в спецификации желательно прочесть, что подразумевает производитель под lifetime warranty.

100 лет может прожить только танк
100 лет может прожить только танк... в мирное время

Покупая то или иное устройство, мы можем, наряду с гарантийным сроком, столкнуться с упомянутой терминологией. Если продавец сообщает, что у выбранного вами процессора, который не подлежит ремонту, MTBF составляет 500000 часов – это неправильно. Для процессора должно быть указано MTTF. MTBF должно употребляться только для ремонтопригодных устройств.

Терминология, используемая производителем и продавцом, употребляется иногда достаточно вольно, так как юридически все определяет описание того в каком значении применен данный термин к данному устройству. Это должно присутствовать в прилагаемых документах. «Уши» такого подхода «растут» из принципов регулирования главного рынка планеты – США, которые вырабатываются Федеральной Комиссией по Торговле (The Federal Trade Commission).

Как оценивается MTBF? Это иллюстрирует нижеследующая диаграмма, где приведена U-образная кривая интенсивности отказов (bathtub curve) для электронного устройства некоего научного оборудования, чтобы читатель мог видеть, что можно иметь в идеале при покупке электроники, в том числе компьютерной.

Надежность научного оборудования

По вертикальной оси отложена вероятность выхода устройства из строя. По горизонтальной оси – время без соблюдения масштаба. Левая кривая перед красной границей соответствует длительности времени в течение которого большая часть устройств выходит из строя при наличии брака. На этом этапе бракованные устройства для научного оборудования отсеиваются сразу же, на заводе при стрессовых испытаниях. Это возможно, т.к. длительность выявления брака не превышает 50 часов и число устройств не велико.

Для комплектующих обычных компьютеров длительность нисходящей кривой значительно больше. В этом случае, для получения информации о длительности периода, когда проявляется заводской брак, очень важны рекламации от покупателя, потому что невозможно выискивать дефекты в течение месяцев на заводе у многих тысяч устройств. К тому же, некоторые наименования комплектующих ПК за год устаревают и сходят с рынка.

Далее следует вторая горизонтальная часть кривой, когда вероятность отказа примерно постоянна. Длительность ее и есть MTBF. Половина этой длительности часто берется производителем в качестве ориентира для определения гарантийного срока.

Справа от красной границы, после окончания срока MTBF, кривая демонстрирует увеличение вероятности отказов. Имеются ввиду не только поломки, но и отклонение параметров работы изделия от требуемых. Это увеличение вероятности выхода обусловлено тем, что ряд элементов в устройстве достигает своего жизненного предела из-за технологии изготовления, т.е. наступает технологический износ элементной базы. Таким образом, время MTBF статистически определяет время работоспособной жизни устройства при заданных условиях эксплуатации.

Вероятностный показатель ненадёжности

Покупателю, не сталкивающемуся с большими объемами продукции, MTBF мало о чем говорит, скорее может ввести в заблуждение. Более понятным и не требующим гаданий был бы вероятностный показатель времени наработки на отказ. Например, “за время работы 3 года вероятность отказа составит не менее 95%”. Т.е., за 3 года работы должны поломаться не более 5% устройств данного типа. И покупатель сразу же знал бы, что из 100 устройств, подобных купленному, есть большая вероятность, что 5 может поломаться в течение 3 лет. И никто не даст гарантию, что это будет не ваш винчестер.

Как определяется надежность компьютерных компонентов? Производитель, как правило, определяет наработку на отказ на основании заявленной надёжности используемых компонентов, кратковременных интенсивных испытаний партии изделий и сложных многофакторных расчетов, учитывающих множество меняющихся во времени причин, которые влияют на термин надежности изделия. Для этого применяется ряд методик, которые хорошо обкатаны военными.

Схематически это выглядит так. В течение года тестировалось 1000 изделий. За время теста 10 вышло из строя. Отсюда MTBF будет равно 1год х (1000шт/10шт) = 100 годам = 876580 часам (1 год = 8765.8 часов). Производитель округлит и напишет 900000 часов, потому что продавец все равно даст гарантию 2-3 года. 900000 часов – это срок, по истечению которого существует высокая вероятность того, что изделие из данной серии выйдет из строя.

Почему MTBF приводят в часах, а не в годах? Это не только оговоренный стандарт: более важно, что цифры получаются со многими нулями и впечатляют. И разница между слабаками и лидерами звучит не катастрофично: 1000000 или 500000 – какая нам разница? В первом случае все устройства выйдут из строя за 114 лет, а во втором случае - за 57 лет. Услышав эти числа, мы при покупке подумаем: «Да мне всего-то надо, чтобы оно проработало 3 года, а не 50, а потом новый куплю.» А на практике первая цифра говорит о том, что вероятность выхода из строя в первый год эксплуатации равна 1/100 лет = 0,01, т.е. один из ста, а во втором случае поломаются в первый же год два из ста. Кому-то обязательно не повезет. Но это «не повезет» должно произойти в течение гарантийного срока.

Надёжность и рынки сбыта

Это все статистика. Кроме нее есть еще ряд субъективных причин, определяющих несколько дополнительных факторов ненадежности устройств, вопреки тому, что из-за жесткости конкуренции, все производители постоянно совершенствуют свою продукцию, стараясь сделать ее еще более надежной не увеличивая стоимости.

Первое. Существуют производители, которые не афишируя поставляют на разные рынки одну и ту же продукцию разного качества. Одна из главных причин такой дискриминации связана с тем, что производитель разделяет рынки на первостепенные (Северная Америка, ЕС, Япония, Южная Корея и т.п.) и третьестепенные. Последние - это все остальные, где покупатель реже обновляет (покупает новые) устройства, а стрелка государственного стимулирования качества ввозимой импортерами продукции на нуле. Это первый отсев по качеству комплектующих.

Пример. В начале этого года компания Seagate получила статус авторизованного субъекта экономической деятельности (Authorized Economic Operator, AEO) в Европейском Союзе. Этот статус предоставляет привилегии при прохождении таможенных служб, так как 27 государств ЕС признали Seagate надежным оператором. Это не только экономит фирме деньги, но и стимулирует ввоз качественной продукции, потому как является одним из факторов высокой репутации.

Вторая причина. С одной стороны производить «вечные» комплектующие для ПК, которые морально и функционально устаревают через 3 года, бессмысленно, а с другой стороны, технологическое удлинение срока жизни работы устройства вызывает значительное удорожание продукции.

Третья проблема связана с тем, что любой производитель свою продукцию тестирует и часть приходится браковать. Иногда тестирует и оптовый покупатель. В случае обнаружения дефекта, бракуется вся партия. Иногда за спиной этого процесса пасутся «умники», которые скупают такую продукцию по дешевке, отбирают или собирают работающие экземпляры, сортируют, упаковывают и поставляют легально или контрабандой в третьи страны. Цена ПК, собранного на «левой» элементной базе будет, естественно, не ниже чем в США или Англии. А прибыль выше.

Следующая диаграмма качественно демонстрирует зависимость затрат производителя по устранению дефектов на разных этапах производственного процесса: разработка (design), тестирование (evaluation), производство (production).

Затраты производителя

Как видно из диаграммы, наибольшие затраты по выявлению дефектов производитель несет при производстве изделия. Именно на этом этапе возможна максимальная экономия средств, т.е. удешевление продукции и за счет этого повышение ее конкурентоспособности, а значит и прибыли. Это добавляет дополнительный фактор, снижающий качество продукции.

Например, MTBF для винчестера в среднем равно 500000 часам или 57 годам. Но фирма дала гарантию всего 1 год, а почему так – скромно умолчала. Придя домой с новым винтом и сбросив на него все свои файлы, покупатель с ужасом может обнаружить, что через 3 месяца его новый HDD со всеми фильмами, фотографиями и прочим приказал долго жить и ремонту не подлежит. Продавец, конечно, его заменит, но кто восстановит потерянное? Именно вышеприведенные причины часто являются тем фактором, о котором продавец скромно умалчивает и почему дает гарантию всего на 1 год.

Почему производитель не пишет MTBF, например, 100 лет вместо 50? Кто возьмется это проверять, если реально цикл жизни составляет, например, 3 года из-за морального устаревания устройства и прекращения его выпуска? В первую очередь это происходит потому, что производитель опирается на результаты натурных стрессовых испытаний и математического моделирования. Данные исследования проводятся независимыми лабораториями, с выдачей сертификатов, и эти данные мы уже читаем, как декларируемый ресурс изделия. Но результаты исследований дают на выходе только вероятность выхода из строя. Какие-то экземпляры устройств могут прожить значительно дольше срока MTBF, и мы с этим иногда сталкиваемся, но вероятность такого события после окончания MTBF резко падает со временем.

Когда мы приходим покупать ПК, нас убеждают, что то, что должно поломаться из-за заводских дефектов, поломается в первый год, и поэтому достаточно годовой гарантии. Из практических исследований известно, что наибольшая часть комплектующих действительно вылетает или в первый год эксплуатации или через несколько лет на стадии уже начавшегося износа. Но это только часть правды, т.к. продавец скрывает главное, а именно: у хорошего товара пики максимальной вероятности выхода из строя также приходятся на первый год и на год износа в будущем, но эта вероятность такова, что экономически все равно выгодно остается давать 2-3 годичный гарантийный срок. Если на ПК 1 год гарантии, значит товар не лучшего качества.

Приведем упрощенный вариант расчета параметра MTBF для ПК собранного в фирме, которая использует обычные комплектующие и дает гарантию на изделие 1 год.

Компоненты ПК

MTBF-MTTF (часы)

MTBF-MTTF (годы)

Вероятность отказа за год

Системная плата

100000

11

0.09

Видеокарта

55000

6

0.17

Процессор

55000

6

0.17

RAM, модуль №1

500000

60

0.01

RAM, модуль №2

500000

60

0.01

HDD

500000

60

0.01

Вентилятор №1

55000

6

0.17

Вентилятор №2

55000

6

0.17

Блок питания

100000

11

0.09

Итого

S = 0.89

Суммируя, получим, что вероятность отказа ПК в течение года = 0,89, а MTBF = 13 месяцев. Т.е., любой компьютер с перечисленными характеристиками с высокой вероятностью должен выйти из строя в течение 13 месяцев, хотя в приведенной таблице самый маленький MTBF у элемента комплектации равен 6 годам и эмоционально эти 6 лет воспринимается как приличный срок.

MTBF в мире винчестеров

Все, что ломается, можно заменить. Но иногда невозможно восстановить утерянную информацию. Надежное хранение данных – это самое узкое место. Сегодня важный вопрос возникает у пользователя о выборе накопителя информации – SSD или HDD? Новые накопители SSD (Solid State Drive) построены на базе твердотельной флэш-памяти. У них отсутствуют вращающиеся диски и движущиеся магнитные головки. Их MTTF уже сегодня достигают заоблачных цифр в 1.5 млн – 2.0 млн часов, т.е. 170 – 230 лет. На некоторые SSD производитель дает ограниченную пожизненную гарантию (limited ifetime warranty). Ограничение обычно накладывается на условия эксплуатации, но могут присутствовать и ряд других условий.

Ниже приведена табличка из Интернет (А.Р. Ольсон и Д.Дж. Лэнглойс) времени жизни типичного SSD, изготовленного по технологии одноуровневой ячейки (SLC) и с количеством циклов запись-считывание-стирание 100 000. Для флэш-памяти это критический параметр, физически ограничивающий срок жизни устройства.

MTBF для винчестера

Usage (GB/day) -- Коэффициент использования (Гигабайт/день); Lifetime of a sequential written data (years) - Срок службы (эксплуатации) при последовательной записи данных (годы). Под сроком службы подразумевается предельное время от начала эксплуатации устройства, включая простои, ремонт и т.п. Цифры впечатляют. Но при этом, почему та же Intel дает всего 3 года гарантии на свои SSD? Вероятно, это перестраховка, т.к. не накопилась еще статистика рекламаций.

Так ли уж необходимо срочно заменять в ПК привычный HDD на SSD или еще можно подождать? Здесь сколько пользователей, столько и мнений. Ясно, что в ближайшие несколько лет SSD заметно подешевеют, а значит и потеснят винчестеры. Но сегодня те, кому надо хранить огромные архивы, за цену заметно меньшую чем у SSD SATA 250GB ($1000 US) могут приобрести и «зазеркалить» для надежности сохранения данных два отличных емких и надежных HDD с гарантией от 2 до 5 лет. Интересно, что для подобных винчестеров MTBF = 750000 часов, т.е. 85 лет, и больше. При определении MTBF для HDD потребительского класса ПК обычно предполагается, что эксплуатироваться он будет по 8 часов, 5 дней в неделю при загрузке, не превышающей 60% от максимальной.

Иногда используют для характеристики срока службы HDD минимальное количество циклов старт/стоп (start/stop cycles). Чем выше этот показатель, тем лучше. На практике, если ПК включается и выключается один раз в сутки и так каждый день недели из года в год, то число циклов, например, 30000 будет соответствовать MTBF = 720000 часам или 82 годам, а для 50000 циклов MTBF = 1200000 часам или 137 годам.

В заключение два слова о блоках питания: как здоровье человеческого организма зависит от качества крови, так и «здоровье» ПК зависит от качества БП. Для ориентации можно сравнить блоки питания в разном ценовом диапазоне:


  • Для 750 Вт модели Seasonic SS-750EM (Тайвань) наработка до первого отказа MTBF = 150000 часов, т.е. 17 лет при температуре эксплуатации +25 С и 5 лет гарантии.

  • Seasonic S12II-500 (Тайвань) наработка до первого отказа MTBF = 100000, т.е. 11 лет и 5 лет гарантии в Европе.

  • БП Cooler Master RS-460-PCAP (Китай) – гарантия 1 год.

Цифры говорят сами за себя.

Выводы

Что можно порекомендовать читателю в рамках изложенного? В качестве преамбулы трудно не упомянуть известное правило: сделав выбор перед походом в магазин, не меняйте его в магазине, лучше отложите покупку – сэкономьте себе и время, и деньги, и нервы.

На что же опереться при выборе ПК или комплектующих – гарантийный срок или MTBF, MTTF? Конечно же, определяющими являются гарантийный срок, а также наличие сервисного обслуживания. Нет никакого смысла покупать изделие, гарантийный срок которого ниже среднего для данного типа.

Теперь о MTBF. Этот параметр можно и нужно использовать в качестве «консультанта» о том, совпадают или нет ваши требования к устройству по максимальному времени наработки на отказ с тем, что предлагает изготовитель. Особенно это принципиально при выборе HDD и SSD: все в ПК можно заменить, кроме утерянной информации.

Сергей Шумейко
07/04.2009

Subscribe
  • Post a new comment

    Error

    Anonymous comments are disabled in this journal

    default userpic

    Your reply will be screened

    Your IP address will be recorded 

  • 0 comments