Jump to content

    
rloc

Производительность современных GPU при вычислении FFT

Recommended Posts

Очень тяжелый проект, и физически и морально.

 

:bb-offtopic: Ваши слова да начальству бы в уши :)

 

По делу:

поищите статейку "FPGA implementation of a 32k accumulating FFT with 2-Gs/s throughput".

Она от 2005 года, но, ИМХО, актуальна. Там на V2Pro и V4.

А сейчас ПЛИС намного "веселее", есть где развернуться ;)

 

Share this post


Link to post
Share on other sites
On 4/5/2018 at 12:22 PM, rloc said:

Скажем, захочу перейти на radix-16, radix-32 ... Что делать в этом случае?

 

On 4/8/2018 at 10:18 AM, rloc said:

Ближе к этапу проектирования станет понятно, как проще и дешевле. 64К и 500МГц - это не конечная цель, можно и больше, важнее иметь масштабируемую структуру, чтобы начать с простого преобразования на 1К и дальше развить до 16M (как пример).

Чем закончились поиски? Удалось решить задачу?

Share this post


Link to post
Share on other sites
2 часа назад, blackfin сказал:

Удалось решить задачу?

R16 и выше - фантазии на этапе изучения современных алгоритмов FFT, увеличение основания не дает никакого выигрыша. GPU также была исключена из рассмотрения по двум причинам - большие накладные расходы на передачу данных в/из GPU и вероятно большую загрузку хоста, а не очень хочется, чтобы конечный пользователь испытывал нехватку производительности под свои задачи. Остановились на оптимальном алгоритме - R42 с учетом реализации в FPGA - конкретно тот вариант, который позволяет обрабатывать данные в потоке (streaming) из расчета по скорости 1:1 временной:частотный отсчет в единицу времени, с минимально возможной шириной полосы памяти на обработку (уменьшение потребления) и возможностью расширения по кол-ву точек обработки за счет дополнительного наращивания однотипных модулей, при исчерпании объема внутренней памяти. С ходу не могу сказать на каком конкретно алгоритме R42 остановились, человек пишет и надо понимать, разработка может растянутся на несколько лет.

Share this post


Link to post
Share on other sites
10 minutes ago, rloc said:

С ходу не могу сказать на каком конкретно алгоритме R42 остановились, человек пишет и надо понимать, разработка может растянуться на несколько лет.

OK. Спасибо..

Share this post


Link to post
Share on other sites

Join the conversation

You can post now and register later. If you have an account, sign in now to post with your account.

Guest
Reply to this topic...

×   Pasted as rich text.   Paste as plain text instead

  Only 75 emoji are allowed.

×   Your link has been automatically embedded.   Display as a link instead

×   Your previous content has been restored.   Clear editor

×   You cannot paste images directly. Upload or insert images from URL.