Перейти к содержанию
    

Странно ведет себя один приорчик на F407, FatFs R0.09, 2011г.

Пишется стрим на флешку, примерно гигабайт в час.

Запись разбита на "1 файл = пол часа".

Т.е. пол часа пишется в tmp файл, потом он переименовывается в реальное имя с номером, и дальше опять пишется в tmp файл.

Между файлами делается unmount/mount, проовали даже питание флешки выключать/ и включать снова.

И все как бы было ОК, пока мы писали свой стрим по часу-два. Все работало идеально, флешки в основном исползовали 2-4ГБ, иноогда 8ГБ

 

А когда попробовали писать подольше да на флешках 8-16ГБ - видим проблему, появляющуюся примерно через 5-6 часов. Девайс продолжает писать, но если его остановить, то флешка уже не читается, фат разрушена, в итоге -> ее под format.

 

Все вызываемые функции FatFs - с проверкой, что FR_ОК возвращается если нет - сообщение на дисплей.

И там ничего! Девайс может 10-14 часов писать (на 16ГБ флешку), потом его останавливешь - и всё, выяснить когда чего произошло уже не получается.

У нас с напарником (код исходной мой, 4-х летней давности, но сейчас он с этим девайсом возится) уже все мысли кончились, не только по тому как найти баг, но и вобще в каком направлении поисков двигаться! Ну разве что, попробовать поставить послеледнюю версию FatFs?

 

Ну не может же такого быть, чтобы если по какой-то причине слетел фат, что при этом все функции f_open, f_close, f_write, f_rename, f_mount возвращают FR_OK?!

 

Ни у кого небыло ничего подобного? Или мож кто чего умного подскажет, как дальше искать?

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

Ни у кого небыло ничего подобного? Или мож кто чего умного подскажет, как дальше искать?

0. проанализируйте посекторно что именно испортилось и где (я обычно WinHex пользую)

1. FAT16 или FAT32? А если поменять?

2. SDIO или SPI? А если поменять?

3. Поищите на самом нижнем уровне, то есть то что самописное к железу доступается.

4. Скорость-помехи-качество питания- качество флэшки?

5. Если проблема появляется практически регулярно- посадите логический анализатор и запишите эти самые 10 часов обмена, в параллель можете и какие-то логические сигналы генерировать и писать в качестве реперных точек, сильно помогает при разборках, а меньше 8-каналки сейчас и не найти анализатор.

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

Или мож кто чего умного подскажет, как дальше искать?

1. Limits: "File size: Upto 4G-1 bytes. (by FAT specs.)"

2. f_sync Используете?

 

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

0. проанализируйте посекторно что именно испортилось и где (я обычно WinHex пользую)

1. FAT16 или FAT32? А если поменять?

2. SDIO или SPI? А если поменять?

3. Поищите на самом нижнем уровне, то есть то что самописное к железу доступается.

4. Скорость-помехи-качество питания- качество флэшки?

5. Если проблема появляется практически регулярно- посадите логический анализатор и запишите эти самые 10 часов обмена, в параллель можете и какие-то логические сигналы генерировать и писать в качестве реперных точек, сильно помогает при разборках, а меньше 8-каналки сейчас и не найти анализатор.

 

0: ok, посмотрим.

1: Fat32 конечно, фат16 не может быть на 16ГБ носителе (больше 2гб - только фат32)

2: SDIO, 4bit

3: пытаемся.

4: питание от батарейки через LDO, флешки разные пробовали.

5: куда его посадить?

 

1. Limits: "File size: Upto 4G-1 bytes. (by FAT specs.)"

2. f_sync Используете?

 

1: стрим примерно 1гигабайт/час, пишем файлы по пол часа, т.е. по пол гига. и глюк происходит примерно на 10-12-м файле (5-6 часов записи).

2: нет, смысл?

The f_sync function performs the same process as f_close function but the file is left opened and can continue read/write/seek operations to the file. This is suitable for the applications that open files for a long time in write mode, such as data logger. Performing f_sync function of periodic or immediataly after f_write function can minimize the risk of data loss due to a sudden blackout or an unintentional media removal.

 

но у нас нет ни блекаута ни mеdia removal, хотя попробовать всунуть периодический вызов f_sync можно, попробуем.

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

2: SDIO, 4bit

 

Попробуйте уменьшить частоту клока, было раз подобное, правда через какое-то время писало кашу-малашу... Уменьшил скорость клока - стало нормально, потом плату переразвели, укоротили проводники до разъема - и со старыми клоками стало работать...

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

Попробуйте уменьшить частоту клока, было раз подобное, правда через какое-то время писало кашу-малашу... Уменьшил скорость клока - стало нормально, потом плату переразвели, укоротили проводники до разъема - и со старыми клоками стало работать...

Клоки уменьшить попробуем, хотя бы ради эксперимента, но не думаю что это что-то даст - 5 часов-же оно работает!

К тому-же, там от проца до разъема флешки - пол сантиметра, проц в БГА почти под ней стоит.

 

P.S. Пытаемся понять, что за такое магическое число "5 часов" (ну от 5-ти до 6-ти) - до 4-4.5 часов записи, никогда ничего не происходило, полет нормальный!

Еще более непонятно - между записью файлов делалось umnount, выключение питания флешки, пауза в сотню миллисеунд (данные в это время в ФИФО писались), потом включение питания флешки, f_mount, f_open, f_write.

ЧЕМ через 5 часов, "ЭТО", отличается от самого первого включения - вот что совершенно непонятно!

(вот не помню только ,делали при этом еще и включение/включение самого SDIO порта).

Писать пробовали и на чистую флешку, и на частично забитую всякой ерундой.

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

ЧЕМ через 5 часов, "ЭТО", отличается от самого первого включения - вот что совершенно непонятно!

Магия может пролазить через питание. Какой температурный режим?

 

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

Магия может пролазить через питание. Какой температурный режим?

 

Скоп в питании ничего не видит, по температуре проблем нет, тем более что оно сейчас раскрытое без корпуса на столе лежит. Про на довольно низкой частоте работает (32МГц, и когда работал на 168МГц, было тоже самое).

 

Впору точно шамана с бубном приглашать....

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

Попробуйте записывать намного чаще. Наверное, дождетесь сбоя намного раньше.

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

Все-таки попробуйте логическим анализатором, подключив его ко всем линиям SD-карты. Понимаю, что объем данных огромен и главная проблема синхронизироваться с моментом когда произошел сбой, но можно попробовать увидеть разницу в диагамме между участками "работает" и "не работает".

Автоматическое декодирование SPI в байты сам использую (на Saleae logic analyzer), но вот SDIO в данные он вроде бы напрямую не умеет, нужно в интернете посмотреть как (есть какие-то софтовые проекты-примочки к нему дополнительные)

 

 

Так удалось выяснить, что именно портится на флешке? статистику результатов набрали?

Например, один и тот же кластер, или один и тот же номер сектора в кластере или та же страница(сектор) таблицы FAT.

 

Проанализируйте что именно сбивается и попробуйте эту ситуацию детектировать проверками. Скорее всего сбой в FAT, можно хоть раз в пару секунд проверять его целостность.

Кстати, в FAT можно увеличить число копий таблицы FAT на диске, можно их использовать для проверок валидности.

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

ЧЕМ через 5 часов, "ЭТО", отличается от самого первого включения

тем что системное время насчитало 5 часов работы - может сбой в отсчете времени и как следствие проблемы с файлами?

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

тем что системное время насчитало 5 часов работы - может сбой в отсчете времени и как следствие проблемы с файлами?

Увеличить частоту системного времени?

 

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

Увеличить частоту системного времени?

Для начала проанализировать на предмет переполнения или возможных ошибок при определении дельты по времени записи.

 

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

тем что системное время насчитало 5 часов работы - может сбой в отсчете времени и как следствие проблемы с файлами?

Эту тему я поддержу.

Насколько мне помнится, в FatFS есть циклы и таймауты в них. Последние должны реализовываться так, чтобы можно было прервать эти циклы, то есть, работать от прерываний и модифицировать флаги/переменные, анализируемые в циклах внутри FatFS. Например, в моей системе, которая есть синхронная round robin по типу protothreads, я вынужден был ответвиться от обработчика SystemTick, чтобы модифицировать то, что нужно для FatFS. Как раскрыта тема в системе у ТС? Может срабатывает какой-то таймаут раньше времени, потому что, например, 5 часов это 18000 секунд, а это около 16K, а если в 10мс тиках, то это 18мио тиков, что есть около 24-битного числа (а SysTick - это 24 бита). Это я выдаю нагорА всякий бред, но может что войдет в резонанс в голове у ТС...

 

 

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

Коллеги, большое спасибо за продолжение обсуждения, пока меня небыло (командировка).

Нашими усилиями было выяснено, что сбой происходит тогда, когда СУММАРНЫЙ обьем файлов перезодит через границу 4Гб.

Было попробовано на другом железе, со старой и новой FatFs, и даже двумя компиляторми (Кейл и ИАР).

Пробовали даже писать не в корневой каталог, а также с синком и без (тормозит он конкретно, если после каждого f_write вызывать!)

Писали блоками, равными кластеру (32К) - так быстрее всего.

От входных данных отвязались, и стали просто писать в цикле с максимальной скоростью - ну не ждать же 5-6 часов!

 

Может быть, у кого есть какая-нибудь система с сд-карточкой, работающей через sdio, может у себя попробовать, вот процедура, которую сегодня пробовали:

#define  block_size 32768
#define  blocks_in_mb  (1024L*1024/block_size)
#define mb_in_file   500
//---
#define start_file 0
#define file_num 10
//
char fn[13];
//
void TestLog(void){
u32 i,j,k, bw;
FRESULT res;
// 
 Font=fnt16x8lat;
 if(IsSDReady()){  // это просто проверка контакта, что карточка вставлена
   SDPowerOn();
   delay_ms(100);		
   if(CheckSD()){  // check OK
   // test ------------------
	 ClrScr();
	 //f_chdir("/as");
	 for(i=start_file;i<file_num+start_file;i++){	 
				sprintf((char *)fn, "/as/fn.%d",i);
				res = f_open(&fsrc, fn, FA_CREATE_ALWAYS | FA_WRITE);
				if(res==FR_OK){
			SDFileOpen=1;	 // simulate working file
			  Show_String((u8 *)fn,2,0);

				  // record 
					for(j=0; j<mb_in_file;j++){	   
							sprintf((char *)txt, "Rec: %d MB	",j+1);
							Show_String(txt,6,0);

						  for(k=0;k<blocks_in_mb;k++){
									res=f_write(&fsrc, &SDBuffer[0], block_size, &bw);
									if(res!=FR_OK){
											f_close(&fsrc);
											sprintf((char *)txt, "Write Error:%d %d",j+1,k);
											Show_String(txt,4,0);
											while(1);
									}
									res=f_sync(&fsrc);
									if(res!=FR_OK){
											f_close(&fsrc);
											sprintf((char *)txt, "Sync Error:%d %d",j+1,k);
											Show_String(txt,4,0);
											while(1);
									}
							}
					}
					res=f_close(&fsrc);
					if(res!=FR_OK){
											f_close(&fsrc);
											sprintf((char *)txt, "Close error:%d %d",j,k);
											Show_String(txt,4,0);
											while(1);						
					}
				}
		}
		//---------------------------------
		Show_String("Write Complete", 0,0);
		SDPowerOff();
		while(1); 
   //------------------------------		
   }else{ // check fails
		SDPowerOff();
		  ClrScr();// return;
		  return;
   }
 }  // no SD
 Show_String("  No SD Card   ",2,0);
 WaitNoKey();
 WaitKey();
 WaitNoKey();
 ClrScr();
 return;
}		 
//-------------------- 
// функция инициализирует и монтирует карточку:
static u8 CheckSD(u8 a){
SD_Error  SDInitResult;
FRESULT res;
ClrScr();
SDInitResult=SD_Init();
   if(SDInitResult==SD_OK){
		Show_String("SD Init OK	 ",2,0);
		delay_ms(1000);
		res=f_mount( 0, &MSD_fatfs );
		if (  res!= FR_OK ){
				 sprintf((char *)txt,"FS Fail	 %02d ",res); 
				 Show_String(txt,4,10);
				 delay_ms(1000);
				 WaitNoKey();
				 WaitKey();
				 WaitNoKey();
				return 0;
		} // FS OK
		Show_String("FS Mount	   ",4,0);
		delay_ms(1000);
		WaitNoKey();
		return 1;
   }  
 // SD Init fails:
	sprintf((char *)txt,"SD Init Fail %02d",SDInitResult);
	Show_String(txt,2,0);
	delay_ms(1000);
	WaitNoKey();
	WaitKey();
	WaitNoKey();
	return 0;
}
//------------------------

 

Функции вывода на дисплей или ожидания кнопок можно закомментировать, или свои подставить.

У нас результаты такие: если file_num =8, то эти 8 байлов пишутся без проблем. Если 9 и больше - все проходит до конца без сообщений об ошибках, но карточка на компе уже не читается, просит форматирования.

Т.е сбой происходит в 9-ми файле. именно там переход границы 4Гб.

Но даже если поставить писать 10 файлов, то программа дорабатывает до конца без ошибок, хот ошибка по идее, была еще в 9-м!

 

 

Можно попробовать не сразу 9-10 файло в писать, а сначала

#define start_file 0

#define file_num 8

 

записать 8 файлов,

потом поставить:

#define start_file 8

#define file_num 1 // или 2

 

и дописать еще 1-2.

 

 

Каждый файл 500мб.

Изменено пользователем IgorKossak
[codebox] для длинного кода, [code] - для короткого!

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

Присоединяйтесь к обсуждению

Вы можете написать сейчас и зарегистрироваться позже. Если у вас есть аккаунт, авторизуйтесь, чтобы опубликовать от имени своего аккаунта.

Гость
Ответить в этой теме...

×   Вставлено с форматированием.   Вставить как обычный текст

  Разрешено использовать не более 75 эмодзи.

×   Ваша ссылка была автоматически встроена.   Отображать как обычную ссылку

×   Ваш предыдущий контент был восстановлен.   Очистить редактор

×   Вы не можете вставлять изображения напрямую. Загружайте или вставляйте изображения по ссылке.

×
×
  • Создать...