Jump to content

    

Где взять инфу по РЕАЛЬНОЙ надёжности ПЛИС?

В 02.12.2019 в 19:37, RobFPGA сказал:

Откуда вы взяли что всего одну? 

Откройте документ на сайте интель, скриншот из которого я запостил,и убедитесь сами, если мне не верите

В 02.12.2019 в 19:37, RobFPGA сказал:

Если в приведенной вами же табличке указано общее время наработки (device*hours)

А с чего Вы взяли, что переменная device больше единицы?

15 часов назад, MrGalaxy сказал:

Кол-во образцов, подвергаемых испытаниям, берётся в зависимости от заданной наработки на отказ.

Нет. Кол-во образцов берётся в зависимости от жадности.

Поэтому интель в своих реабилити репортах в некоторых таблицах указывает, что число испытывавшихся образцов равно 3 шт или даже 1 шт

Share this post


Link to post
Share on other sites

Приветствую!

2 hours ago, DeadCadDance said:

А с чего Вы взяли, что переменная device больше единицы?

С того что в начале  этой же таблички есть подробное описание с какой периодичностью проводят тесты, и сколько отбираются  образцов и с какой периодичностью для различных испытаний.

Или вы реально считаете что 1 чип наработал в сумме 813,326  часов (для StratixV) или  2,173,058 (для Cyclone5) ?  

2 hours ago, DeadCadDance said:

Поэтому интель в своих реабилити репортах в некоторых таблицах указывает, что число испытывавшихся образцов равно 3 шт или даже 1 шт

То есть у вас  не только с математикой но и со чтением проблемы - Укажите точно страницу/строку где в этой таблице  написано что для испытаний на lifetime использовано всего 1 или 3 чипа? 

Удачи! Rob.

Share this post


Link to post
Share on other sites
On 11/29/2019 at 4:19 PM, DeadCadDance said:

если по ним посчитать MTTF, то получается что среднее время до отказа у ПЛИС - это сотни, тысячи и десятки тысяч лет.

А в чем проблема в сотнях и тысячах лет? Для примера, у обычного жесткого диска МTBF примерно 1 миллион часов или 114 лет, но этот MTBF гарантируется только в пределах его заданного срока службы 3-5 лет. Т.е. в тот период, когда случайные отказы превалируют над отказами из-за износа.

И эта цифра легко проверяется реальными испытаниями в реальных датацентрах. Они там сотни тысяч винчестеров используют. Берете тысячу винчестеров из партии, прогоняете их 1000 часов, получаете миллион часов наработки. Если за это время отказало не более одного винчестера из этой партии  - у вас среднее время наработки больше 1 миллиона часов.

Еще более подходящей аналогией являются люди. Среднее время наработки на отказ обычного человеческого организма в 25-летнем возрасте - почти тысяча лет. Но средний срок жизни - всего лишь 75 лет. Просто первая цифра определяет среднюю вероятность умереть до этого срока - например от тяжелой болезни или ДТП.

Вот и в ПЛИСах так - время жизни не коррелирует с наработкой на отказ. И миллионы часов, если их правильно анализировать - это не маркетинговые фишки, а вполне реальные цифры.

https://www.reliableplant.com/mtbf-31702

Share this post


Link to post
Share on other sites
22 часа назад, RobFPGA сказал:

Или вы реально считаете что 1 чип наработал в сумме 813,326  часов

А в чём проблема? Ведь 813 часов - это всего лишь 33,8 суток

22 часа назад, RobFPGA сказал:

То есть у вас  не только с математикой но и со чтением проблемы - Укажите точно страницу/строку где в этой таблице  написано что для испытаний на lifetime использовано всего 1 или 3 чипа? 

image.thumb.png.15cad548be4e14bc47e6cf064485098c.png

3 часа назад, syoma сказал:

Берете тысячу винчестеров из партии, прогоняете их 1000 часов, получаете миллион часов наработки. Если за это время отказало не более одного винчестера из этой партии  - у вас среднее время наработки больше 1 миллиона часов.

А если ни одного, то трилиард?:punish::dash2:

Математика - она такая математика.:negative:

3 часа назад, syoma сказал:

Еще более подходящей аналогией являются люди. Среднее время наработки на отказ обычного человеческого организма в 25-летнем возрасте - почти тысяча лет. Но средний срок жизни - всего лишь 75 лет. Просто первая цифра определяет среднюю вероятность умереть до этого срока - например от тяжелой болезни или ДТП.

Вот и в ПЛИСах так - время жизни не коррелирует с наработкой на отказ. И миллионы часов, если их правильно анализировать - это не маркетинговые фишки, а вполне реальные цифры.

https://www.reliableplant.com/mtbf-31702

Это слишком заумно для меня.

Вы мне по простому скажите: отработает у меня устройство 30 лет без единого сбоя если в устройстве  60 ПЛИС емкостью 1 миллион LE?

Share this post


Link to post
Share on other sites

Приветствую!

Ну как я и предполагал - читать доки как минимум не хотим. :rtfm: :declare:

То что вы обвели в кружочек это размер лота  для конкретного типа испытаний  ESD (это когда мс бьют током, больно!) - причем это число мс берется только для испытаний на ESD и берется с КАЖДОЙ партии  раз в квартал  или чаще в зависимости различных условий.  А еще в каждой партии берется 77/45/25  штук  мс для lifetime теста, который гоняется как минимум 2000 часов на этих мс. А еще берется ...   Впрочем это наверно не изменить вашей веры что буржуи вам  врут. И что не могут они делать такие крутые FPGA которые работают так долго.  

1 hour ago, DeadCadDance said:

А в чём проблема? Ведь 813 часов - это всего лишь 33,8 суток

Ну и - Товарищ:pioneer: имей ввиду! Во всех цифрах в этой табличке (в частности  813,326) запятая отделяет группы порядков (..., миллионов, тысяч), а не  десятичную часть! :laugh1::lol2:

 Удачи! Rob. 

Share this post


Link to post
Share on other sites
14 hours ago, DeadCadDance said:

А если ни одного, то трилиард?

Нет. Это только означает, что >1000000. Тестируете дальше, пока не получите отказы. Либо увеличивайте количество тестовых экземпляров.

14 hours ago, DeadCadDance said:

Вы мне по простому скажите: отработает у меня устройство 30 лет без единого сбоя если в устройстве  60 ПЛИС емкостью 1 миллион LE?

30 лет - это 262 800 часов. И тут сразу кроется одно но (на примере таблицы):

Quote

Intel has a product reliability goal for long term failure rate. The long term failure rate is listed as <200 FIT at 55°C use condition. Inherent in this requirement are two key components

Product needs to meet lifetime goal of 100,000h of useful life.

The wear-out mechanisms are outside of the useful life of the product.

Т.е. Intel вас сразу предупреждает, что надежность они считают для срока жизни(полезного использования) в  100 тыс часов или 11 лет. Т.е. после этого срока могут наступить процессы износа и Intel уже вам ничего не гарантирует. Это значит, что если вы хотите получить указанную надежность, то каждые 11 лет вы должны вытаскивать все эти ваши 60 ПЛИС из устройства и заменять на новые, независимо от того, есть ли среди них отказавшие или нет. Собственно из-за этого во всех системах, где есть критерии надежности Refirbishment электроники делается примерно через 10 или 15 лет независимо ни от чего.

Дальше. Предположим вы меняете ПЛИС каждые 10 лет.

Т.е. за 30 лет вы поменяете три комплекта по 60 ПЛИС.  Это 180 ПЛИС с наработкой каждой по 10 лет или 87600 часов. Суммарно -  это почти 16 миллионов часов наработки. Если вы найдете ПЛИСину с большей чем 16 лимонов часов наработкой на отказ или FIT меньше 63, то может быть.
В вашей этой таблице 5  даны результаты и по ним выходит, что у всех там приведенных ПЛИС FIT меньше, следовательно, Да. Статистически ваше устройство с 60 ПЛИС может проработать без отказов 30 лет, но при условии, что вы будете менять ПЛИСины на новые каждые 10 лет. Весело, да? Не забудьте напомнить об этом заказчику - он несомненно обрадуется! :biggrin: Лучше всего лет через 10 после установки!

Ну и не забывайте, что это только статистика. Т.е. у вас ПЛИСина может сгореть и через день после включения, и это будет нормально. Также не забывать, что должна быть поправка на температуру и условия использования.

ПС вы там что-то пишете про сбои и отказы. Выберите что-то одно, так как это разные понятия. Выше расчет для отказов.

 

Share this post


Link to post
Share on other sites
13 hours ago, DeadCadDance said:

отработает у меня устройство 30 лет

к вышесказанному про собственно сами ПЛИС следует добавить (или отнять) - надежность самих печатных плат, остальных компонентов. Ну и , если устройство обрабатывает поток информации - вероятность появления в нем ошибки, которую нельзя определить/исправить...

Share this post


Link to post
Share on other sites
В 05.12.2019 в 10:28, syoma сказал:

вы там что-то пишете про сбои и отказы. Выберите что-то одно, так как это разные понятия. Выше расчет для отказов.

Естественно меня интересуют сбои (т.е. восстанавливаемые отказы). Потому что они чаще чем отказы

Edited by DeadCadDance

Share this post


Link to post
Share on other sites
4 hours ago, DeadCadDance said:

Естественно меня интересуют сбои (т.е. восстанавливаемые отказы). Потому что они чаще чем отказы

Если я правильно понимаю эту таблицу:

image.thumb.png.71c53dcbf287ad5e2f38e21de9891f06.png

То там указаны именно невосстановимые механизмы, т.е. отказы. Следовательно по сбоям  надо искать другие данные.

Например, начинать отсюда и так далее: https://www.intel.com/content/dam/www/programmable/us/en/pdfs/literature/wp/wp-01207-single-event-functional-interrupt.pdf

https://www.intel.com/content/www/us/en/programmable/documentation/drj1530911544883.html

Xilinx публикует данные по сбоям - https://www.xilinx.com/support/documentation/user_guides/ug116.pdf, страница 29 и дальше, причем там есть зависимость и от размера прошивки и от количества использованных ресурсов, так что это будет весьма специфическая цифра для конкретного проекта. Но в принципе эти дела можно скорректировать при правильном дизайне прошивки.

Share this post


Link to post
Share on other sites

А если по Вашему опыту - они часто сбоят?

Из-за скачков питания или помех по питанию, электромагнитных наводок или каких-то случайных необъяснимых причин

Сбой заключается в том, что где-то (в ячейке BRAM, SRAM,CRAM, регистре, ячейке флеш , на ножке микросхемы или ещё где) в какой-то интервал времени должна была быть единичка, а там нолик, или наоборот в какой-то интервал времени должен бы быть нолик, а там единичка

Share this post


Link to post
Share on other sites
On 12/7/2019 at 10:57 PM, DeadCadDance said:

А если по Вашему опыту - они часто сбоят? 

Из-за скачков питания или помех по питанию, электромагнитных наводок или каких-то случайных необъяснимых причин 

Так таких ситуаций может быть полно. Но для этого и существуют испытания на восприимчивость и правильный дизайн платы. И для этого нет смысла рассчитывать на какие-либо показатели надежности, так как у каждого своя схема и та же самая ПЛИСина в одном проекте будет работать годами без сбоев, а в другом сбоить каждый день из-за плохого источника питания.

Поэтому и есть смысл приводить показания надежности только для одного случая - когда все сделано по уму и эти факторы исключены.

И тогда "случайной необъяснимой причиной" сбоя согласно умным книжкам остается только SEU почему-то.

 

Share this post


Link to post
Share on other sites
56 минут назад, syoma сказал:

 так как у каждого своя схема и та же самая ПЛИСина в одном проекте будет работать годами без сбоев, а в другом сбоить каждый день из-за хренового источника питания.

И еще... Например есть параметр SSO. В одном случае ПЛИС может дергать выводами, например в 24 мА, в количестве - "под завязку", да еще "fast", а в другой плате вроде все то-же самое в схеме платы внешне, но есть какие-то менее нагруженные режимы работы ПЛИС... 

Share this post


Link to post
Share on other sites
5 hours ago, iosifk said:

И еще... Например есть параметр SSO. В одном случае ПЛИС может дергать выводами, например в 24 мА, в количестве - "под завязку", да еще "fast", а в другой плате вроде все то-же самое в схеме платы внешне, но есть какие-то менее нагруженные режимы работы ПЛИС... 

Именно поэтому я предпочитаю испытывать ПЛИС с финальной прошивкой или очень близкой к ней. Прикольные они просто - и потребление гуляет в широких пределах и вот эта самосоздаваемая электромагнитная обстановочка вокруг...

Share this post


Link to post
Share on other sites
6 часов назад, iosifk сказал:

И еще... Например есть параметр SSO. В одном случае ПЛИС может дергать выводами, например в 24 мА, в количестве - "под завязку", да еще "fast", а в другой плате вроде все то-же самое в схеме платы внешне, но есть какие-то менее нагруженные режимы работы ПЛИС... 

Скажите! А как из Вашего более чем 50-ти летнего опыта: можно использовать ПЛИСы в ответственных применениях где цена сбоя очень высока (когда несанкционированное самопроизвольное изменение в результате сбоя даже одного бита из триллиона приводит к катастрофе) без троирования?

Или это моветон?

syoma

Скажите! А Вы сталкивались с таким, что ПЛИС сбоИт из-за того, что где-то рядом щёлкают релюшки или коммутируются мощные нагрузки?

Просто у них питание 0,8 Вольта. А значит (по теории) у них помехоустойчивость должна быть никакущая

Share this post


Link to post
Share on other sites
2 часа назад, DeadCadDance сказал:

Скажите! А как из Вашего более чем 50-ти летнего опыта: можно использовать ПЛИСы в ответственных применениях где цена сбоя очень высока (когда несанкционированное самопроизвольное изменение в результате сбоя даже одного бита из триллиона приводит к катастрофе) без троирования?

Могу сказать следующее. Когда я занимался "в ответственных применениях", то тогда ПЛИС не было.

А вот в компании actel.ru Косткин и Co занимались разработкой чего-то для ответственного применения. И об этом были какие-то статьи в КиТ... Но давно, лет наверное 7-10 назад.

Что касается последнего вопроса то надо уточнять более конкретно. Например если есть три канала,  два из которых в работе, а третий тестируется. И два канала сравнивают результат. Так вот, может быть ситуация, когда из производительности хватит для перезапуска задачи при несравнении. И тогда это будет не "Отказ", а "Сбой"... А может быть, что времени на повторный пересчет задачи не хватает. И тогда это - "Отказ" и без третьего канала никак... Так что невозможно говорить об  "в ответственных применениях" вообще. Можно более точно сказать только о конкретных случаях...

Share this post


Link to post
Share on other sites

Create an account or sign in to comment

You need to be a member in order to leave a comment

Create an account

Sign up for a new account in our community. It's easy!

Register a new account

Sign in

Already have an account? Sign in here.

Sign In Now