Точность БПФ float vs fixed point

Ответить

Озон 0

12 августа, 2015

Опубликовано 12 августа, 2015 · Жалоба

Здравствуйте!

Не получается найти информацию по точности алгоритмов БПФ с фиксированной и плавающей запятой. В литературе встречаются фразы, что если нужна высокая точность, то лучше использовать плавающую точку.

Задача - 4096 точечное преобразование , входные данные 16-разрядные. Понятно, что разрешающая способность определяется к-вом точек. Но что подразумевается под точностью, точность амплитуды или точность по частоте?

Алгоритмы 1.15 и FP single выдадут идентичные результаты по частоте? (точность по амплитуде совершенно не критична)

От этого зависит выбор DSP.

Цитата

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

FatRobot 0

12 августа, 2015

Опубликовано 12 августа, 2015 · Жалоба

Что-то у вас все "в одну кучу": и точность, и разрешающая способность.

ДПФ/БПФ - линейная операция и к ней применимы все методы анализа, что и для фильтров. Хотите лучше разрешать слабые сигналы на фоне сильных - увеличивайте динамический диапазон вычислителя и промежуточных результатов. Вот и весь сказ.

Цитата

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

serjj1333 0

12 августа, 2015

Опубликовано 12 августа, 2015 · Жалоба

Вот модель, меняя параметр WIDTH можно сравнивать реализацию fixed point FFT и floating point single precision FFT.

clear all;

Ns = 4096;
fs = 100e3;
Ts = 1/fs;
t = 0:Ts:(Ns-1)*Ts;
SNR = 30;
df = fs/Ns;
f = 0:df:(Ns-1)*df;

f0 = 7e3;
f1 = 19e3;
A0 = 1e0;
A1 = 1e-1;
x = real(A0*exp(1i*2*pi*f0*t) + A1*exp(1i*2*pi*f1*t));

y = awgn(x, SNR, 'measured');

WIDTH = 16;
y_fi = sfi(y, WIDTH);
w = fi_radix2twiddles(Ns);
w_fi = sfi(w, WIDTH);

%y = y.*w;
Y_fp = abs(fft(single(y))); Y_fp = Y_fp/max(Y_fp);
Y_fi = abs(fi_m_radix2fft_withscaling(y_fi, w_fi));
Y_fi_ver = double(Y_fi); Y_fi_ver = Y_fi_ver/max(Y_fi_ver);
err = Y_fp - Y_fi_ver;
err = err .* err;

str = sprintf('fixed point n%d', WIDTH);
figure(1); clf();
subplot(2, 1, 1);
hold on;
plot(f, 20*log10(double(Y_fp) + 1e-15), 'b');
plot(f, 20*log10(double(Y_fi_ver) + 1e-15), 'xr');
title('ABS(FFT) result');
xlabel('frequency, Hz');
ylabel('abs(fft), dB');
legend('floating point single', str);
grid on;
hold off;
axis([0 fs/2 -60 1]);

subplot(2, 1, 2);
plot(f, 10*log10(err + 1e-15));
grid on;
xlabel('frequency, Hz');
ylabel('Square error, dB');
axis([0 fs/2 -120 0]);

Пример графика для вашего случая

Для 15 бит, как видно из графика, ошибка fixed point реализации пренебрежима мала в сравнении с разрешающими способностями Фурье.

Цитата

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

FatRobot 0

12 августа, 2015

Опубликовано 12 августа, 2015 · Жалоба

2-3 разряда - нормальное пренебрежение. угу.

С другой стороны, если разрядность ацп - 12-13 бит, то шум кварнтования на входе будет преобладать над шумом вычислителя в s1.15

Для 15 бит, как видно из графика, ошибка fixed point реализации пренебрежима мала в сравнении с разрешающими способностями Фурье.

Цитата

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

Озон 0

12 августа, 2015

Опубликовано 12 августа, 2015 · Жалоба

Большое спасибо!

Цитата

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

ViKo 1

12 августа, 2015

Опубликовано 12 августа, 2015 · Жалоба

Вот модель, меняя параметр WIDTH можно сравнивать реализацию fixed point FFT и floating point single precision FFT.
...

R2014b

Undefined function 'fi_radix2twiddles' for input arguments of type 'double'

Цитата

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

serjj1333 0

12 августа, 2015

Опубликовано 12 августа, 2015 · Жалоба

У меня R2010b, возможно они поменяли с того времени набор функций из fi тулбокса. fi_radix2twiddles и fi_m_radix2fft_withscaling не входят в состав стандартных функций (на них даже хелпа нет), я их вытащил из примера. Вставил в свой скрипт, он их откуда-то из своих недр добыл. Собственно в примере есть их исходники.

Цитата

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

prig 0

13 августа, 2015

Опубликовано 13 августа, 2015 · Жалоба

... (точность по амплитуде совершенно не критична)
...

От этого зависит выбор DSP.

А Вы уверены, что это действительно так?

2-3 разряда - нормальное пренебрежение. угу.

С другой стороны, если разрядность ацп - 12-13 бит, то шум кварнтования на входе будет преобладать над шумом вычислителя в s1.15

Угу.

А точнее, для БПФ 4к, 16 бит, радикс-2 потребуется 1 защитный бит, и максимальный рост шума на 12-ти стадиях - в 12^0.5 раза.

Т.е., собственный шум 16 бит БПФ радикс-2 можно оценивать на уровне 13 бит. Для сигнала с эффективными 12-ю битами это действительно вполне адекватно.

Для радикс-4 потребуется 2 защитных бита. Потери на стадиях не изменятся (в 12^0.5 раза). Т.е., суммарная потеря на БПФ - около 4-х бит. С групповой плавающей точкой, ессно.

Для чистых 12-ти бит данных этого уже маловато.

И тут есть ещё один момент. Если для задачи ТС скорость критична, он должен учитывать заполнение кэша 1-го уровня данными и коэффициентами. Если оные в кэш не помещаются, производительность БПФ падает катастрофически.

Так что, при оценке потребной разрядности лучше добавлять какой-то резерв, так как переход на большую разрядность БПФ может оказаться неприемлем по скорости именно из-за заполнения кэша.

Кроме того, БПФ на перемножилках 1.15*1.15 потребует нормализации после каждой стадии(групповая плав. точка), что даёт проигрыш в производительности по сравнению с 32*32 того или иного вида при прочих равных.

Имха, с фикс. точкой на 16-ти битах стоит связываться только при большой серийности продукции и очень жёстких ограничениях на стоимость комплектации.

Для всего остального лучше сразу ориентироваться на 32*32 (фикс или плавающая - не принципиально). Только кэша 1-го уровня побольше, побольше, побольше...

Цитата

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

Озон 0

13 августа, 2015

Опубликовано 13 августа, 2015 · Жалоба

А Вы уверены, что это действительно так?

В смысле что мне не нужна точность по амплитуде? Да, в спектре интерес к амплитуде +/- лапоть, интересует именно значение частоты. Т.к. задача определить значение частоты гармонического сигнала на фоне шума.

Если для задачи ТС скорость критична, он должен учитывать заполнение кэша 1-го уровня данными и коэффициентами. Если оные в кэш не помещаются, производительность БПФ падает катастрофически.

Да, скорость критична.

Имха, с фикс. точкой на 16-ти битах стоит связываться только при большой серийности продукции и очень жёстких ограничениях на стоимость комплектации.
Для всего остального лучше сразу ориентироваться на 32*32 (фикс или плавающая - не принципиально). Только кэша 1-го уровня побольше, побольше, побольше...

16 бит я указал с запасом, как максимально возможные. Вполне вероятно АЦП 12-разрядным будет.

Оно как бы да, 32 битный процессор вроде самое то, да и серийность низкая. Но дороже, больше потребление, выше порог вхождения

Цитата

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

serjj1333 0

14 августа, 2015

Опубликовано 14 августа, 2015 · Жалоба

Оно как бы да, 32 битный процессор вроде самое то, да и серийность низкая. Но дороже, больше потребление, выше порог вхождения

У вас какие полосы? Посмотрите stm32 M4, там есть FPU и уже готовые библиотеки с реализованными FFT на вкус и цвет. Дёшево и сердито. А с discovery достаточно одного дня, чтобы уже начать под него писать.

Цитата

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

prig 0

14 августа, 2015

Опубликовано 14 августа, 2015 · Жалоба

В смысле что мне не нужна точность по амплитуде? Да, в спектре интерес к амплитуде +/- лапоть, интересует именно значение частоты. Т.к. задача определить значение частоты гармонического сигнала на фоне шума.
...

16 бит я указал с запасом, как максимально возможные. Вполне вероятно АЦП 12-разрядным будет.

Оно как бы да, 32 битный процессор вроде самое то, да и серийность низкая. Но дороже, больше потребление, выше порог вхождения

- Я к тому, что "точность по амплитуде" - это многофакторная величина, в том числе связанная с уровнем шума. А шум Вам всё равно придётся учитывать, особенно при регистрации "слабых" сигналов.

- Если рабочая полоса будет существенно ниже полосы оцифровки, ENOB может "неожиданно" увеличиться.

Да и вообще, 16*16 - это очень узенькие штанишки. Всегда есть риск растолстеть и не втиснуться.

- Доп. издержки для 32*32 могут с лихвой окупиться снижением затрат/времени на разработку софта, сопровождение, возможную модернизацию.

А если возможна унификация элементной базы и инструментария для нескольких типов приборов, выигрыш может и умножится.

(Помнится, около месяца гонял скверный редкопроявляющийся косяк. В результате нашлась одна собственная ошибка и одна незадекларированная аппаратная ошибка процессора. Аппаратная ошибка проявлялась только при определённом сочетании кода на ассемблере и некоторого специфичного набора данных. Хорошо, что пофиксилась. Но на фикс и тотальные проверки ушло ещё около месяца, так как проверялось на реальном железе с многосуточными прогонами.

А всё потому, что фирменные целчисленные библиотеки для 16*16 пришлось обрабатывать напильником. Для 32*32, особенно float, потребность в обработке напильником может снизиться почти до нуля.)

Для низкой серийности лучше ориентироваться на float. Софт будет проще и прозрачней, а затраты практически идентичны фикс. точке 32*32.

Доступность float для самого широкого круга задач - это уже свершившийся факт.

У того же TI, плав. точка фактически стала базовой для всех новых высокопроизводительных 32-битных сигнальников.

А ценники и возможные издержки могут приятно удивить.

Ну а если задача позволяет, STM-ы и прочие армо-мипсы могут удивить ещё больше. Так что, совет serjj может оказаться для Вас самым полезным.

Цитата

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

Озон 0

15 августа, 2015

Опубликовано 15 августа, 2015 (изменено) · Жалоба

У вас какие полосы? Посмотрите stm32 M4, там есть FPU и уже готовые библиотеки с реализованными FFT на вкус и цвет. Дёшево и сердито. А с discovery достаточно одного дня, чтобы уже начать под него писать.

если задача позволяет, STM-ы и прочие армо-мипсы могут удивить ещё больше. Так что, совет serjj может оказаться для Вас самым полезным.

Да вот собственно сейчас как раз и взвешиваются все за и против Cortex-M7 vs real DSP.

Анализируемый диапазон частот 1кГц...2МГц. Реалтайм не обязателен, накопили отсчеты, посчитали, накопили, посчитали (на низких частотах с перекрытием окон).

В кортексе смущает, что по бенчмаркам 1к FFT делается примерно на 2 - 3 мс, у DSP примерно за 20 - 50 мкс. Также напрягает в кортексах недетерминированное время выполнения команд.

А в DSP напрягает всё остальное))

Изменено 15 августа, 2015 пользователем ozone

Цитата

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

Corner 0

28 августа, 2015

Опубликовано 28 августа, 2015 · Жалоба

Использую исключительно целочисленную математику. Дробную часть выделяю в конце после бабочек. Разницы с плавучкой никакой.

Цитата

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

Krys 2

3 сентября, 2015

Опубликовано 3 сентября, 2015 · Жалоба

А что значит "вычисляю"? Если уже получилась только целая часть, то откуда из неё получится дробная?

Цитата

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

Corner 0

6 февраля, 2016

Опубликовано 6 февраля, 2016 · Жалоба

А что значит "вычисляю"? Если уже получилась только целая часть, то откуда из неё получится дробная?

Элементарно. При вычислениях я считаю, что целой части вообще нет нигде. Что исходные данные лишь дробная часть, что результат. То есть, если вход 16 бит, 32767 это почти 1, а -32768 это почти -1. И коэффициенты тоже в таком же духе. Только 18 бит со знаком родные для ПЛИС. Каждый раз округляю модуль до вхождения результата в 18 бит со знаком.

Цитата

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

Присоединяйтесь к обсуждению

Вы можете написать сейчас и зарегистрироваться позже. Если у вас есть аккаунт, авторизуйтесь, чтобы опубликовать от имени своего аккаунта.

Ответить в этой теме...

× Вставлено с форматированием. Вставить как обычный текст

Разрешено использовать не более 75 эмодзи.

× Ваша ссылка была автоматически встроена. Отображать как обычную ссылку

× Ваш предыдущий контент был восстановлен. Очистить редактор

× Вы не можете вставлять изображения напрямую. Загружайте или вставляйте изображения по ссылке.

Указать URL изображения

Подписчики 0

Озон 0

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

FatRobot 0

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

serjj1333 0

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

FatRobot 0

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

Озон 0

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

ViKo 1

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

serjj1333 0

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

prig 0

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

Озон 0

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

serjj1333 0

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

prig 0

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

Озон 0

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

Corner 0

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

Krys 2

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

Corner 0

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

Присоединяйтесь к обсуждению

Обзор

Активность