Перейти к содержанию
    

Есть задачи где FPGA на 10 МГц благодаря параллельной обработке данных уделает обычный проц на 1 ГГц...

...А если учесть, что современные плисины класса v4, v5 SX линейки имеют от 192 до 1056(!!!) MAC блоков, работающих вплоть до 450-550 мгц (для справедливости скинем этот параметр до 250 мгц - это по моему опыту верхний край стабильной разводки забитого кристалла без танцев с бубном, но все равно), то универсальные DSP процессоры становится просто жалко :crying: Если конечно в ближайшее время не изобретут процессор, работающий на частоте 50 ггц (приблизительно столько надо, чтобы побороть верхние плисины :) )

З.Ы. это если конечно не стоит вопрос цены, хайэнд сегмент. В противном случае у DSP появляются варианты...

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

...А если учесть, что современные плисины класса v4, v5 SX...
Спасибо за поддержку, приятно что нашлись единомышленники... :)

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

то универсальные DSP процессоры становится просто жалко :crying: Если конечно в ближайшее время не изобретут процессор, работающий на частоте 50 ггц (приблизительно столько надо, чтобы побороть верхние плисины :) )

 

Это относится только к алгоритмам относительно небольшим и регулярным.

Посмотрю я на Вас реализовавшего какой-нибудь вокодер G723.1 или melp объёмом стандартного кода 200 кбайт. "1056 мас блоков" нервно курят в сторонке...

У FPGA на больших алгоритмах будет только один шанс - иметь на борту память и DSP

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

Это относится только к алгоритмам относительно небольшим и регулярным.

Посмотрю я на Вас реализовавшего какой-нибудь вокодер G723.1 или melp объёмом стандартного кода 200 кбайт. "1056 мас блоков" нервно курят в сторонке...

Ничто не мешает использовать какой-нибудь soft-CPU с большим объёмом кода но с обильными вставками аппаратных ускорителей... По крайней мере, некоторое беспроводное оборудование за счет этого только и выплывает, ибо мощности сигнального процессора не хватает, а если использовать аппаратные ускорители из этой же ПЛИС некоторых тяжелых но несложных операций то всё пучком...

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

...А если учесть, что современные плисины класса v4, v5 SX линейки имеют от 192 до 1056(!!!) MAC блоков, работающих вплоть до 450-550 мгц (для справедливости скинем этот параметр до 250 мгц - это по моему опыту верхний край стабильной разводки забитого кристалла без танцев с бубном, но все равно), то универсальные DSP процессоры становится просто жалко :crying:
А если учесть , что имеются и такие монстры в мире DSP, как, например, Nvidia GT200 или AMD RV620, становятся жалкими не только универсальные ПЛИС, но и разработчики, пытающиеся соорудить на них что-либо подобное. ;)

 

...Если конечно в ближайшее время не изобретут процессор, работающий на частоте 50 ггц (приблизительно столько надо, чтобы побороть верхние плисины :) )
...Если, конечно, в ближайшее время не изобретут ПЛИС, работающую на частоте 100 ГГц, да ещё раз в 10 большего объёма (приблизительно столько надо, чтобы побороть верхние процы). :)

 

...З.Ы. это если конечно не стоит вопрос цены, хайэнд сегмент. В противном случае у DSP появляются варианты...
Даже если не стоит вопрос цены, у ПЛИС "вариантов" не появится. :(

 

Ничто не мешает использовать какой-нибудь soft-CPU с большим объёмом кода но с обильными вставками аппаратных ускорителей...
Мешает.

Попробуйте, например, сделать soft-BlackFin, или soft-TMS320C64, а потом посчитайте, сколько это будет стоить и жрать.

О затратах на проектирование пока скромно умолчим. :)

 

...По крайней мере, некоторое беспроводное оборудование за счет этого только и выплывает, ибо мощности сигнального процессора не хватает, а если использовать аппаратные ускорители из этой же ПЛИС некоторых тяжелых но несложных операций то всё пучком...
А кто с этим спорит?

Некоторые несознательные товарищи утверждают, однако, что DSP умерли, и в мире сигнальной обработки всецело рулят ПЛИС.

Я же уверен, что ПЛИС не будут рулить никогда. Ни по цене, ни по производительности, ни по энергопотреблению, ни по функциональной нагрузке против DSP.

ПЛИС - это от бедности. Никак иначе. :)

Изменено пользователем Stanislav

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

Мешает.

Попробуйте, например, сделать soft-BlackFin, или soft-TMS320C64, а потом посчитайте, сколько это будет стоить и жрать.

О затратах на проектирование пока скромно умолчим. :)

Зачем городить полновесные DSP для узких задач? Так есть же готовые! Свободные/бесплатные, с готовыми GCC, всегда готовые принять новые инструкции и т.д. ...

Но я ж не возражаю, DSP+FPGA - хорошо, по отдельности - каждый не очень...

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

Так есть же готовые! Свободные/бесплатные, с готовыми GCC, всегда готовые принять новые инструкции и т.д. ...
Да простит меня "yes": ...произвел некий ФПГА бенчмаркинг - может интересно кому...

задачка - выбор дешевого ФПГА тысяч на 30 LUT

проект VHDL код leon3 (www.gaisler.ru)

сконфигурено так, чтобы не было всяческих платформ-депендент элементов и минимальное использование блочных памятей

 

проект leon3 использовался как тест, а не задачка развести проц

 

синтезировал synplify_pro 8.6.2 с максимальным набором опций оптимизации

 

получил

Xilinx Spartan3 58MHz

Altera CycloneII 50MHz

Lattice XP 48MHz

Actel ProASIC3 14MHz

 

у ксайлинкса при большом заполнении >80% P&R ухудшает результаты, но, наверно, такое свойство у всех производителей ФПГА присутствует...

:laughing:

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

Не беспокойтесь, blackfin'ы я тоже люблю... :)

Честно говоря, по той ссылке (www.gaisler.ru) не нашел никакого leon3, поэтому непонятно о чем речь... Но сказать могу одно - Nios2 у меня на среднем по скорости Cyclone 2 работал на чуть больше 100 МГц... (а может и больше смог бы, но я не измерял), если учесть что в него можно впихнуть инструкции, которые будучи выполнены аппаратно будут экономить очень много тактов... Например http://www.altera.com/products/ip/processo...2h/ni2-c2h.html

В общем тут всё не однозначно => холивар :)

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

Зачем городить полновесные DSP для узких задач? Так есть же готовые! Свободные/бесплатные, с готовыми GCC, всегда готовые принять новые инструкции и т.д. ...

Но я ж не возражаю, DSP+FPGA - хорошо, по отдельности - каждый не очень...

Вот и славно. Каждому овощу - своё место на грядке. :)

................................................................................

.

 

Может, кого заинтересует инфа: фирма NVIDIA выпустила свободно распространяемые средства разработки для своих вычислительных монстров, которые можно найти в каждой современной видеокарте.

http://ru.wikipedia.org/wiki/CUDA

http://cuda.ixbt.com/cuda.shtml

 

А вот характеристики маленького суперкомпьютера, который может быть установлен почти в любой пысюк:

http://www.nvidia.com/object/geforce_gtx_280.html

 

Думаю, время, когда все нюансы архитектуры GPU будут также открыты, не за горами, и пользователям станет доступным программирование подобных суперпроцессоров на низком уровне, что значительно увеличит вычислительную мощь компьютеров на задачах, допускающих высокую степень распараллеливания. Хотя, CUDA, вроде бы, позволяет многое делать уже сейчас:

http://www.nvidia.com/object/cuda_what_is.html

 

Современные GPU могут эффективно выполнять весьма сложные программы с высокой степенью параллелизма. В качестве примера можно привести вот такой "прикол":

Beaten by GPU in chess, Chess engine running entirely on GPU

Товарищ там при "абсчёте" вариантов использовал все доступные 64 треда в параллель. За что и поплатился. :biggrin:

 

AMD несколько отстали, но интегрированные средства разработки для их собственных GPU, по слухам, ожидаются в этом году также.

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

Stanislav: не порите чушь. cuda и им подобные технологии - это жалкая попытка gpu компаний занять нишу computing accelerators на fpga - тип допустимых операций весьма жалок, и это не учитывая накладные расходы разложения на оные своего алгоритма.

Чтобы не быть голословным в заявлениях крутизны dsp - возьмем типичную DSP задачу - воть хоть мой примерчик 2006 года с http://electronix.ru/forum/index.php?showtopic=15866 - это тупая fpga реализация ITU compliant адикма 16кбит - время кодирования сэмпла 243 нс, тактовая кажись 70 Mhz - и сотворите нам чудо, а мы посмотрим сколько будет стоить этот dsp и на какой частоте оно будет працювать. сразу скажу - цена данного (устаревшего первого) циклона менее $20, заполнение его 50%, т.е. имеем стоимость $10 на 8 E1 потоков. если я не дай бог пересоберу это дело под третий циклон и немного пооптимизирую- то могу уменьшить время кодирования в 10 раз (при 100MHz) при еще меньшей площади. ну не будем сразу так напрягать- попытайтесь добиться хоть этого, ждемс ... ;)

 

P.S. похожие темы были когда-то затронуты, см. http://electronix.ru/forum/index.php?showtopic=12380

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

Чтобы не быть голословным в заявлениях крутизны dsp - возьмем типичную DSP задачу - воть хоть мой примерчик 2006 года с http://electronix.ru/forum/index.php?showtopic=15866 - это тупая fpga реализация ITU compliant адикма 16кбит - время кодирования сэмпла 243 нс, тактовая кажись 70 Mhz - и сотворите нам чудо, а мы посмотрим сколько будет стоить этот dsp и на какой частоте оно будет работать..

Всё уже украдено до нас: SPIRIT - G.726 / (Datasheet.)

TI C55xx Platform:

Peak MIPS   Encoder    Decoder    (Encoder + Decoder)    (8-channel Encoder + Decoder)
Linear law    5.3         4.7            10.7                        85.6
u/A law       5.5         6.4            13.4                        107.2

Для DSP с частотой 200МГц получается: 200/5.5 = 36 каналов кодирования.

Цена DSP по прайсу TI: TMS320VC5510A-200 - $25.20

 

Итого: $25.20/36 = $0.7 на канал..

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

что-то нигде нету в datasheet'е данных о том сколько инструкций занимает кодирование ? похоже просто на впаривание - просьба апеллировать вещами с которыми реально сталкивались, а не надыбанных поиском в google.

 

теперь стоимость :

 

пусть ep1c12 стоит $50, судя по einfo.ru (хотя кто его теперь купит за такие деньги):

 

8E1 = 8 * 30 = 240 каналов, 50$/240 = $0.208 на канал

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

DSP пастухи, fpga овцы так будет ещё очень долго. Покрайней мере до тех пор пока fpga несмогут делать сложные алгоритмы, работы с видео,(не тупое суммирование каналов) скажем в кадр вставить рекламму где надо, звук жать хорошо. Насмотрелся я на реализацию на fpga медиа серверов, там она размером с пол ладони и по пять шесть штук. за место них у нас например камень с тремя дсп и такая же производительность не говоря уже про размеры на плате и энерго потребление. приплюсуем два интерфейса по гигабиту. :)

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

сложные алгоритмы, работы с видео

 

как вариант обработки видео :

 

http://focus.ti.com/paramsearch/docs/param...aramCriteria=no

 

помимо того что стоит 2 ядра в довеске два аппаратных сопроцессора по обработке видео + аппаратные акселераторы.

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

DSP пастухи, fpga овцы так будет ещё очень долго. Покрайней мере до тех пор пока fpga несмогут делать сложные алгоритмы, работы с видео,(не тупое суммирование каналов) скажем в кадр вставить рекламму где надо, звук жать хорошо. Насмотрелся я на реализацию на fpga медиа серверов, там она размером с пол ладони и по пять шесть штук. за место них у нас например камень с тремя дсп и такая же производительность не говоря уже про размеры на плате и энерго потребление. приплюсуем два интерфейса по гигабиту. :)

 

Как сказать - иногда бывают проекты где все наоборот - dsp овцы а fpga пастухи, так как загрузить оверлей в dsp проще чем переконфигурить fpga.

насчет видео все обстоит также как и в остальных dsp задачах - применение fpga выйдет дешевле и быстрее. В Вашем случае обчая архитектура системы подкачала

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

Присоединяйтесь к обсуждению

Вы можете написать сейчас и зарегистрироваться позже. Если у вас есть аккаунт, авторизуйтесь, чтобы опубликовать от имени своего аккаунта.

Гость
Ответить в этой теме...

×   Вставлено с форматированием.   Вставить как обычный текст

  Разрешено использовать не более 75 эмодзи.

×   Ваша ссылка была автоматически встроена.   Отображать как обычную ссылку

×   Ваш предыдущий контент был восстановлен.   Очистить редактор

×   Вы не можете вставлять изображения напрямую. Загружайте или вставляйте изображения по ссылке.

×
×
  • Создать...