Singer 0 1 июля, 2008 Опубликовано 1 июля, 2008 · Жалоба Есть задачи где FPGA на 10 МГц благодаря параллельной обработке данных уделает обычный проц на 1 ГГц... ...А если учесть, что современные плисины класса v4, v5 SX линейки имеют от 192 до 1056(!!!) MAC блоков, работающих вплоть до 450-550 мгц (для справедливости скинем этот параметр до 250 мгц - это по моему опыту верхний край стабильной разводки забитого кристалла без танцев с бубном, но все равно), то универсальные DSP процессоры становится просто жалко :crying: Если конечно в ближайшее время не изобретут процессор, работающий на частоте 50 ггц (приблизительно столько надо, чтобы побороть верхние плисины :) ) З.Ы. это если конечно не стоит вопрос цены, хайэнд сегмент. В противном случае у DSP появляются варианты... Цитата Поделиться сообщением Ссылка на сообщение Поделиться на другие сайты Поделиться
1891ВМ12Я 0 1 июля, 2008 Опубликовано 1 июля, 2008 · Жалоба ...А если учесть, что современные плисины класса v4, v5 SX...Спасибо за поддержку, приятно что нашлись единомышленники... :) Цитата Поделиться сообщением Ссылка на сообщение Поделиться на другие сайты Поделиться
fontp 0 1 июля, 2008 Опубликовано 1 июля, 2008 · Жалоба то универсальные DSP процессоры становится просто жалко :crying: Если конечно в ближайшее время не изобретут процессор, работающий на частоте 50 ггц (приблизительно столько надо, чтобы побороть верхние плисины :) ) Это относится только к алгоритмам относительно небольшим и регулярным. Посмотрю я на Вас реализовавшего какой-нибудь вокодер G723.1 или melp объёмом стандартного кода 200 кбайт. "1056 мас блоков" нервно курят в сторонке... У FPGA на больших алгоритмах будет только один шанс - иметь на борту память и DSP Цитата Поделиться сообщением Ссылка на сообщение Поделиться на другие сайты Поделиться
1891ВМ12Я 0 1 июля, 2008 Опубликовано 1 июля, 2008 · Жалоба Это относится только к алгоритмам относительно небольшим и регулярным. Посмотрю я на Вас реализовавшего какой-нибудь вокодер G723.1 или melp объёмом стандартного кода 200 кбайт. "1056 мас блоков" нервно курят в сторонке... Ничто не мешает использовать какой-нибудь soft-CPU с большим объёмом кода но с обильными вставками аппаратных ускорителей... По крайней мере, некоторое беспроводное оборудование за счет этого только и выплывает, ибо мощности сигнального процессора не хватает, а если использовать аппаратные ускорители из этой же ПЛИС некоторых тяжелых но несложных операций то всё пучком... Цитата Поделиться сообщением Ссылка на сообщение Поделиться на другие сайты Поделиться
Stanislav 0 1 июля, 2008 Опубликовано 1 июля, 2008 (изменено) · Жалоба ...А если учесть, что современные плисины класса v4, v5 SX линейки имеют от 192 до 1056(!!!) MAC блоков, работающих вплоть до 450-550 мгц (для справедливости скинем этот параметр до 250 мгц - это по моему опыту верхний край стабильной разводки забитого кристалла без танцев с бубном, но все равно), то универсальные DSP процессоры становится просто жалко :crying:А если учесть , что имеются и такие монстры в мире DSP, как, например, Nvidia GT200 или AMD RV620, становятся жалкими не только универсальные ПЛИС, но и разработчики, пытающиеся соорудить на них что-либо подобное. ;) ...Если конечно в ближайшее время не изобретут процессор, работающий на частоте 50 ггц (приблизительно столько надо, чтобы побороть верхние плисины :) )...Если, конечно, в ближайшее время не изобретут ПЛИС, работающую на частоте 100 ГГц, да ещё раз в 10 большего объёма (приблизительно столько надо, чтобы побороть верхние процы). :) ...З.Ы. это если конечно не стоит вопрос цены, хайэнд сегмент. В противном случае у DSP появляются варианты...Даже если не стоит вопрос цены, у ПЛИС "вариантов" не появится. :( Ничто не мешает использовать какой-нибудь soft-CPU с большим объёмом кода но с обильными вставками аппаратных ускорителей...Мешает. Попробуйте, например, сделать soft-BlackFin, или soft-TMS320C64, а потом посчитайте, сколько это будет стоить и жрать. О затратах на проектирование пока скромно умолчим. :) ...По крайней мере, некоторое беспроводное оборудование за счет этого только и выплывает, ибо мощности сигнального процессора не хватает, а если использовать аппаратные ускорители из этой же ПЛИС некоторых тяжелых но несложных операций то всё пучком...А кто с этим спорит? Некоторые несознательные товарищи утверждают, однако, что DSP умерли, и в мире сигнальной обработки всецело рулят ПЛИС. Я же уверен, что ПЛИС не будут рулить никогда. Ни по цене, ни по производительности, ни по энергопотреблению, ни по функциональной нагрузке против DSP. ПЛИС - это от бедности. Никак иначе. :) Изменено 1 июля, 2008 пользователем Stanislav Цитата Поделиться сообщением Ссылка на сообщение Поделиться на другие сайты Поделиться
1891ВМ12Я 0 2 июля, 2008 Опубликовано 2 июля, 2008 · Жалоба Мешает. Попробуйте, например, сделать soft-BlackFin, или soft-TMS320C64, а потом посчитайте, сколько это будет стоить и жрать. О затратах на проектирование пока скромно умолчим. :) Зачем городить полновесные DSP для узких задач? Так есть же готовые! Свободные/бесплатные, с готовыми GCC, всегда готовые принять новые инструкции и т.д. ... Но я ж не возражаю, DSP+FPGA - хорошо, по отдельности - каждый не очень... Цитата Поделиться сообщением Ссылка на сообщение Поделиться на другие сайты Поделиться
blackfin 23 2 июля, 2008 Опубликовано 2 июля, 2008 · Жалоба Так есть же готовые! Свободные/бесплатные, с готовыми GCC, всегда готовые принять новые инструкции и т.д. ...Да простит меня "yes": ...произвел некий ФПГА бенчмаркинг - может интересно кому... задачка - выбор дешевого ФПГА тысяч на 30 LUT проект VHDL код leon3 (www.gaisler.ru) сконфигурено так, чтобы не было всяческих платформ-депендент элементов и минимальное использование блочных памятей проект leon3 использовался как тест, а не задачка развести проц синтезировал synplify_pro 8.6.2 с максимальным набором опций оптимизации получил Xilinx Spartan3 58MHz Altera CycloneII 50MHz Lattice XP 48MHz Actel ProASIC3 14MHz у ксайлинкса при большом заполнении >80% P&R ухудшает результаты, но, наверно, такое свойство у всех производителей ФПГА присутствует... :laughing: Цитата Поделиться сообщением Ссылка на сообщение Поделиться на другие сайты Поделиться
1891ВМ12Я 0 2 июля, 2008 Опубликовано 2 июля, 2008 · Жалоба Да простит меня "yes": ...произвел некий ФПГА бенчмаркинг - может интересно кому... :laughing: Не беспокойтесь, blackfin'ы я тоже люблю... :) Честно говоря, по той ссылке (www.gaisler.ru) не нашел никакого leon3, поэтому непонятно о чем речь... Но сказать могу одно - Nios2 у меня на среднем по скорости Cyclone 2 работал на чуть больше 100 МГц... (а может и больше смог бы, но я не измерял), если учесть что в него можно впихнуть инструкции, которые будучи выполнены аппаратно будут экономить очень много тактов... Например http://www.altera.com/products/ip/processo...2h/ni2-c2h.html В общем тут всё не однозначно => холивар :) Цитата Поделиться сообщением Ссылка на сообщение Поделиться на другие сайты Поделиться
Stanislav 0 2 июля, 2008 Опубликовано 2 июля, 2008 · Жалоба Зачем городить полновесные DSP для узких задач? Так есть же готовые! Свободные/бесплатные, с готовыми GCC, всегда готовые принять новые инструкции и т.д. ... Но я ж не возражаю, DSP+FPGA - хорошо, по отдельности - каждый не очень... Вот и славно. Каждому овощу - своё место на грядке. :) ................................................................................ . Может, кого заинтересует инфа: фирма NVIDIA выпустила свободно распространяемые средства разработки для своих вычислительных монстров, которые можно найти в каждой современной видеокарте. http://ru.wikipedia.org/wiki/CUDA http://cuda.ixbt.com/cuda.shtml А вот характеристики маленького суперкомпьютера, который может быть установлен почти в любой пысюк: http://www.nvidia.com/object/geforce_gtx_280.html Думаю, время, когда все нюансы архитектуры GPU будут также открыты, не за горами, и пользователям станет доступным программирование подобных суперпроцессоров на низком уровне, что значительно увеличит вычислительную мощь компьютеров на задачах, допускающих высокую степень распараллеливания. Хотя, CUDA, вроде бы, позволяет многое делать уже сейчас: http://www.nvidia.com/object/cuda_what_is.html Современные GPU могут эффективно выполнять весьма сложные программы с высокой степенью параллелизма. В качестве примера можно привести вот такой "прикол": Beaten by GPU in chess, Chess engine running entirely on GPU Товарищ там при "абсчёте" вариантов использовал все доступные 64 треда в параллель. За что и поплатился. AMD несколько отстали, но интегрированные средства разработки для их собственных GPU, по слухам, ожидаются в этом году также. Цитата Поделиться сообщением Ссылка на сообщение Поделиться на другие сайты Поделиться
Harbour 0 3 июля, 2008 Опубликовано 3 июля, 2008 · Жалоба Stanislav: не порите чушь. cuda и им подобные технологии - это жалкая попытка gpu компаний занять нишу computing accelerators на fpga - тип допустимых операций весьма жалок, и это не учитывая накладные расходы разложения на оные своего алгоритма. Чтобы не быть голословным в заявлениях крутизны dsp - возьмем типичную DSP задачу - воть хоть мой примерчик 2006 года с http://electronix.ru/forum/index.php?showtopic=15866 - это тупая fpga реализация ITU compliant адикма 16кбит - время кодирования сэмпла 243 нс, тактовая кажись 70 Mhz - и сотворите нам чудо, а мы посмотрим сколько будет стоить этот dsp и на какой частоте оно будет працювать. сразу скажу - цена данного (устаревшего первого) циклона менее $20, заполнение его 50%, т.е. имеем стоимость $10 на 8 E1 потоков. если я не дай бог пересоберу это дело под третий циклон и немного пооптимизирую- то могу уменьшить время кодирования в 10 раз (при 100MHz) при еще меньшей площади. ну не будем сразу так напрягать- попытайтесь добиться хоть этого, ждемс ... ;) P.S. похожие темы были когда-то затронуты, см. http://electronix.ru/forum/index.php?showtopic=12380 Цитата Поделиться сообщением Ссылка на сообщение Поделиться на другие сайты Поделиться
blackfin 23 3 июля, 2008 Опубликовано 3 июля, 2008 · Жалоба Чтобы не быть голословным в заявлениях крутизны dsp - возьмем типичную DSP задачу - воть хоть мой примерчик 2006 года с http://electronix.ru/forum/index.php?showtopic=15866 - это тупая fpga реализация ITU compliant адикма 16кбит - время кодирования сэмпла 243 нс, тактовая кажись 70 Mhz - и сотворите нам чудо, а мы посмотрим сколько будет стоить этот dsp и на какой частоте оно будет работать.. Всё уже украдено до нас: SPIRIT - G.726 / (Datasheet.) TI C55xx Platform: Peak MIPS Encoder Decoder (Encoder + Decoder) (8-channel Encoder + Decoder) Linear law 5.3 4.7 10.7 85.6 u/A law 5.5 6.4 13.4 107.2 Для DSP с частотой 200МГц получается: 200/5.5 = 36 каналов кодирования. Цена DSP по прайсу TI: TMS320VC5510A-200 - $25.20 Итого: $25.20/36 = $0.7 на канал.. Цитата Поделиться сообщением Ссылка на сообщение Поделиться на другие сайты Поделиться
Harbour 0 3 июля, 2008 Опубликовано 3 июля, 2008 · Жалоба что-то нигде нету в datasheet'е данных о том сколько инструкций занимает кодирование ? похоже просто на впаривание - просьба апеллировать вещами с которыми реально сталкивались, а не надыбанных поиском в google. теперь стоимость : пусть ep1c12 стоит $50, судя по einfo.ru (хотя кто его теперь купит за такие деньги): 8E1 = 8 * 30 = 240 каналов, 50$/240 = $0.208 на канал Цитата Поделиться сообщением Ссылка на сообщение Поделиться на другие сайты Поделиться
MIkler 0 4 июля, 2008 Опубликовано 4 июля, 2008 · Жалоба DSP пастухи, fpga овцы так будет ещё очень долго. Покрайней мере до тех пор пока fpga несмогут делать сложные алгоритмы, работы с видео,(не тупое суммирование каналов) скажем в кадр вставить рекламму где надо, звук жать хорошо. Насмотрелся я на реализацию на fpga медиа серверов, там она размером с пол ладони и по пять шесть штук. за место них у нас например камень с тремя дсп и такая же производительность не говоря уже про размеры на плате и энерго потребление. приплюсуем два интерфейса по гигабиту. :) Цитата Поделиться сообщением Ссылка на сообщение Поделиться на другие сайты Поделиться
des00 25 4 июля, 2008 Опубликовано 4 июля, 2008 · Жалоба сложные алгоритмы, работы с видео как вариант обработки видео : http://focus.ti.com/paramsearch/docs/param...aramCriteria=no помимо того что стоит 2 ядра в довеске два аппаратных сопроцессора по обработке видео + аппаратные акселераторы. Цитата Поделиться сообщением Ссылка на сообщение Поделиться на другие сайты Поделиться
Harbour 0 4 июля, 2008 Опубликовано 4 июля, 2008 · Жалоба DSP пастухи, fpga овцы так будет ещё очень долго. Покрайней мере до тех пор пока fpga несмогут делать сложные алгоритмы, работы с видео,(не тупое суммирование каналов) скажем в кадр вставить рекламму где надо, звук жать хорошо. Насмотрелся я на реализацию на fpga медиа серверов, там она размером с пол ладони и по пять шесть штук. за место них у нас например камень с тремя дсп и такая же производительность не говоря уже про размеры на плате и энерго потребление. приплюсуем два интерфейса по гигабиту. :) Как сказать - иногда бывают проекты где все наоборот - dsp овцы а fpga пастухи, так как загрузить оверлей в dsp проще чем переконфигурить fpga. насчет видео все обстоит также как и в остальных dsp задачах - применение fpga выйдет дешевле и быстрее. В Вашем случае обчая архитектура системы подкачала Цитата Поделиться сообщением Ссылка на сообщение Поделиться на другие сайты Поделиться