Jump to content

    
Sign in to follow this  
Kompot

Не стартует Atmega644P

Recommended Posts

Стороннее производство смонтировало нам 30 одинаковых контроллеров на вышеуказанном чипе. То есть техпроцесс, комплектующие - все идентичное. Питание чипа 5В. Ресет на питание через резистор 4К7 и на землю 0.1мкФ керамика. Ага, присутствует еще интерфейс RS485 в виде драйвера ST485. Управляет контроллер несколькими светодиодами. Проще некуда.

Проблема - на одной плате из 30 не стартует прошивка. Используется самописный (нашими программистами) бутлоадер и далее переход на собственно исполняемый код. Бутлоадер не использует прерываний и является отдельным проектом, с исполняемым кодом не связан.

В этой ситуации логично было предположить, что чип бракован, перегрели при пайке, плата дохлая и тд, то есть отказ железа. На кварце генерация есть. Вариант с неправильными фьюзами исключен. Правда грыз червячок сомнения, тем более что случайно удалось установить, что при некоторой критической скорости нарастания напряжения питания чип все-таки заводится и работает. Примерно так: если питание выросло от нуля до 5В за время, меньшее 2 мС, то чип стартует. Если больше 3-х - гарантированно не стартует. Вроде железячная проблема. Манипулирование с BOD, параметрами кварца и тд. ничего не изменили. А поскольку питается весь модуль от 12В через линейный стабилизатор и фильтры, то скорость нарастания в реальной системе порядка 4 мС, вот он и не стартует. А почему тогда стартует на остальных 29 платах?

Но червячок сомнения все грыз... Пришлось написать свой тестовый кусочек кода моргание светодиода, используя другой компилятор (ImageCraft). Так вот этот тестовый код стартует всегда, независимо от скорости нарастания. Даже на 15 миллисекундах! Прихожу к выводу, что железо-то - рабочее! Тут нужно уточнить, что наши программисты используют GCC из состава WinAVR.

Путем морального избиения программистов удалось установить, что чип стартует всегда и попадает в бутлоадер, откуда управление всегда передается на main() (установлено по отладочному светодиоду). А там либо работает, либо виснет.

 

Почему та же прошивка работает без проблем на 29 платах?

Почему она не стартует на одной плате если питание нарастает медленно?

Почему она таки стартует, если питание нарастает быстро?

Кто\что может быть виноват(о): GCC, железо, программист?

Есть у кого подобный опыт?

 

Share this post


Link to post
Share on other sites
Есть у кого подобный опыт?

 

Попадалось. Причина оказалась в бракованной ПП. Изготовитель самовольно изменил диаметр переходного - сделал тоньше. Видимо, некоторые переходные отверстия получились некачественные. Две платы из партии повели себя именно так. Запустить процессор удалось, пробросив перемычку от стабилизатора, на питание проца. Плата заработала без замечаний.

 

При программировании никаких проблем не наблюдалось. Вот это и сбивало с толку.

Edited by V.K

Share this post


Link to post
Share on other sites

А найти участок, где происходит залип? Может дело не в микроконтроллере, а в драйвере 485, какой-нибудь интеррупт от него на старте, и программа убежала в бесконечность принимать несуществующий пакет. Короче, - возможно контроллер стартует сразу, а драйвер на этой плате запаздывает, и из-за неотслеживания ситуации, что внешнеее оборудование может быть ещё не готово к работе, программа уходит в неверное состояние. Сделайте в main в самом начале паузу в 100мс.

Share this post


Link to post
Share on other sites

64К на управление светодиодами - кон. гениально!! Вы сами ответили на свой вопрос. Продолжайте избиение программистов и запишите Ваш код не через boot, а любым программатором. Можете загнать код в студию и посмотреть где виснет.

Share this post


Link to post
Share on other sites
А найти участок, где происходит залип? Может дело не в микроконтроллере, а в драйвере 485, какой-нибудь интеррупт от него на старте, и программа убежала в бесконечность принимать несуществующий пакет. Короче, - возможно контроллер стартует сразу, а драйвер на этой плате запаздывает, и из-за неотслеживания ситуации, что внешнеее оборудование может быть ещё не готово к работе, программа уходит в неверное состояние. Сделайте в main в самом начале паузу в 100мс.

Так собственно весь вопрос в том, можно ли так написать программу, чтобы она вот так выделывалась только на одной плате из тридцати.

 

Лично у меня очень сильные подозрения на программу. При всем желании не получается убедить себя, что железо дефектное.

 

Буду дальше продолжать пинать программистов, они очень не любят отладку.

 

64К на управление светодиодами - кон. гениально!! Вы сами ответили на свой вопрос. Продолжайте избиение программистов и запишите Ваш код не через boot, а любым программатором. Можете загнать код в студию и посмотреть где виснет.

Ладно-ладно...

Светодиодов около 700. Такой же процессор в целях унификации (хотя и избыточно) применяется во всех остальных модулях. Цена (не поверите) - не волнует. Зато два последовательных порта весьма востребованы.

При попытке скомпилировать DEBUG версию размер прошивки превышает размер флеши.

Студия не имеет периферии. И 29 таких же плат работают. Да и эта работает, если резче подать питание.

А вы не из программистов будете? :cranky:

 

Я больше всего опасался проблем со стартом CPU, особенно при медленном нарастании питания. Оказалось не оно.

Тогда что?

Share this post


Link to post
Share on other sites

Поменяйте процессоры с этой и любой из 29-ти рабочих плат.

И все сразу станет ясно.

 

А "зависнуть" программа вообще не может при условии работоспособности всего изделия.

"Зависла" - значит программист при написании не учёл всех возможных условий работы изделия.

Share this post


Link to post
Share on other sites
Я больше всего опасался проблем со стартом CPU, особенно при медленном нарастании питания. Оказалось не оно.

Тогда что?

Неинициализированная переменная?

Share this post


Link to post
Share on other sites
Неинициализированная переменная?

А почему на 29 остальных работает?

Уж тогда скорее разрешенное прерывание по смене пина без обработчика при наличии пинов, болтающихся в воздухе.

Это бы все объяснило. В том числе физическое различие плат - как там защитные диоды на входах борются за уровень.

 

Поменяйте процессоры с этой и любой из 29-ти рабочих плат.

И все сразу станет ясно.

 

А "зависнуть" программа вообще не может при условии работоспособности всего изделия.

"Зависла" - значит программист при написании не учёл всех возможных условий работы изделия.

 

Спасибо за идею! Следовало самому догадаться. Сразу исключаются и плата и процессор. Осталось только аккуратненько снять.

 

А насчет "не может" - еще как может :biggrin:

Вот "не должна" - это да, правда.

 

:santa2:

 

Share this post


Link to post
Share on other sites

Однако была подобная тема с контроллерами AT91SAM7S.

Часть плат не стартовали при температуре корпуса ниже +20 градусов цельсия.

Требовали повторного включения питания.

Из 150 плат проблемма проявилась на 4 (фабричный монтаж),

из 10 плат не стартовали 5 ( сборка вручную, феном).

Проблемма оказалась в "перегреве" при сборке.

По даташиту микросхема выдерживает +260С однократно.

Практически нагрев до +250С приводил к нарушению внутренних цепей старта микросхемы.

Подобный эффект в меньшем обьёме наблюдался так же у микросхем AT91RM9200-QI-002.

Share this post


Link to post
Share on other sites
Спасибо за идею! Следовало самому догадаться. Сразу исключаются и плата и процессор. Осталось только аккуратненько снять.

Ответ

Пришлось написать свой тестовый кусочек кода моргание светодиода, используя другой компилятор (ImageCraft). Так вот этот тестовый код стартует всегда, независимо от скорости нарастания. Даже на 15 миллисекундах! Прихожу к выводу, что железо-то - рабочее!

Или Вы сами себе не верите :biggrin:

Студия не имеет периферии.

Какой?

При попытке скомпилировать DEBUG версию размер прошивки превышает размер флеши.
Это в студии?

Share this post


Link to post
Share on other sites
Так собственно весь вопрос в том, можно ли так написать программу, чтобы она вот так выделывалась только на одной плате из тридцати.

Да раз плюнуть. Допустим сразу же после старта ловите низкий уровень на каком-нибудь выводе. При этом ошибочно считаете, что при включении платы на этот вывод моментально подаётся высокий уровень, а на деле именно на этой плате какой-то компонент запаздывает на 1 миллисекунду. Программа-то выполняется на реальном железе, и надо учитывать что есть переходное состояние, когда на входах может быть всё что угодно. Я ещё раз намекаю - сделайте элементарную паузу на старте. Если спасёт, значит проблема именно в этом.

Share this post


Link to post
Share on other sites
Так собственно весь вопрос в том, можно ли так написать программу, ч.......

Запросто, вот написал. На 2313 постоянно перегружается , а на 4313 работает при этом код и фьюзы один в один и плата одна (панелька). А всего лишь последовательность двух команд идущих друг за другом , надо было поменять местами. Теперь работает и там и там.

Share this post


Link to post
Share on other sites

Докладываю результат:

При прошивке очередной "улучшенной версии" программы не заработали уже 5 плат из 9. Начальство в панике и начало чехвостить потенциальных виновных.

Тут же причина была найдена, баг исправлен.

 

На свою голову дал этим прекрасным людям (программистам) возможность общаться с железкой через отдельный последовательный порт (отладочный, никаких иных функций не несущий). Вот у них и был отладочный билд, когда в железку можно было достучаться извне и получить ответ.

Во-первых, эти умнейшие создания (ну да, программисты) никак сами себе объяснить не могут, как в релиз попала эта функциональность, предназначенная только для отладки.

А во-вторых, использовался вызов функции scanf() для чтения из отладочного порта. Разумеется, никакого кастомного getch() и в помине не было. Вот на этом scanf() происходила перезагрузка с вероятностью, зависящей от скорости нарастания питающего напряжения.

Также при более тщательном досмотре нашлись куча неинициализированных переменных.

Убрали вызов scanf() - все стало работать правильно.

 

Вывод: железо полностью рабочее. А за scanf() надо бы железной линейкой по рукам... Вот им и не хватает 64к флеша.

 

P.S. Как эта фирмварь писалась: супер-пупер программер (Qt, GUI, физик по образованию) пол-года мусолил, так и не написал, съехал (типа, мало времени, очень загружен). Дали приходящему на 1 день в неделю студенту. Тот за месяц написал кое-что кое-как работающее. И вот это "кое-что" зарелизили. А искать ошибки посадили третьего, который впервые (как и первые два) видит АВР.

P.P.S. А я предлагал менеджеру, давай мол я напишу фирмварь, но поскольку числюсь электроником, заплатите мне за это премию. Отказался наотрез. Типа, "это шантаж".

 

Думаете, гирлянды делаем? Неа, медицинское оборудование. Думаете, в Тамбове в сарае? Нифига, центр Европы.

Думаете, китайцы на коленках нам платы паяют? Опять мимо, сам Филипс.

 

Блин, каждый раз дрожат колени когда вхожу в самолет. Одна надежда - а вдруг у Боинга не так, как у нас...

А мы ведь людям в глаз 20mW лазером светим...

Как жить дальше...

 

 

тему, наверное, можно закрыть.

Share this post


Link to post
Share on other sites
...Думаете, гирлянды делаем? Неа, медицинское оборудование. Думаете, в Тамбове в сарае? Нифига, центр Европы. Думаете, китайцы на коленках нам платы паяют? Опять мимо, сам Филипс....

 

 

Вы это.... уважаемый... не пугайте так. я грешным делом думал про россию описалово идёт. в ней родёмой на энтузиазме, упорстве и совести конечных исполнителей частенько всё держится. софтверные конторы на этом и выезжают частенько.

 

да уж... там у вас не програмисты вообще, чисто по моим меркам. то что описали - это студенческие потуги (я на полном серьёзе). рассмотрите фриланс либо удалённый филиал - толку больше будет, при тех же(либо меньших) затратах. да и на этом форуме любой толковый разработчик сделает вам софт на должном уровне при должном финансировании. экономия на спичках у вас там...

 

и менагер ничего не мыслит в производстве, если элементарный контроль на производстве не может обеспечить.

 

да уж...

если желание будет - организовать филиал, обращайтесь - это моё :)

Edited by kolobok0

Share this post


Link to post
Share on other sites
Guest
This topic is now closed to further replies.
Sign in to follow this