anton 0 12 ноября, 2007 Опубликовано 12 ноября, 2007 · Жалоба У меня нет полной статистики по FPGA, но сдается мне, что довольно много их идет в среднесерийных изделиях, которые и не помышляют перейти на ASIC. Точно панас в своих видео камерах типа 400 модели ипользовал. Цитата Поделиться сообщением Ссылка на сообщение Поделиться на другие сайты Поделиться
Evgeny_CD 0 12 ноября, 2007 Опубликовано 12 ноября, 2007 · Жалоба Пример теста AD TS201 выполнение БПФ1024 25мкс пень 3.4 17мкс. Точность операций обинаковая 32 плавучка. (цена за пень 100$ TS201 за такие деньги врятли купите) Вы знаете ДСП камни старше TS201? Я немного знаю целочисленные DSP от TI. 64 серия - быстрая молотилка, ее на пне очень не просто объехать. Даже на 4-х ядреном. Цитата Поделиться сообщением Ссылка на сообщение Поделиться на другие сайты Поделиться
anton 0 12 ноября, 2007 Опубликовано 12 ноября, 2007 · Жалоба Я немного знаю целочисленные DSP от TI. 64 серия - быстрая молотилка, ее на пне очень не просто объехать. Даже на 4-х ядреном. Пожалуй да для 1ггц но тем не менее быстродей думаю примерно равное даже с 2х ядерной коркой на 3ггц. Думаю что 64 будет обходить интел только в задачах видео обработки где у него сильная оптимизация, насчет сравнеия с 4 ядерным не уверен и впринципе все зависит от правильности разводки задачи по потокам. (по 64 много сказать не могу плюс целочисленой почти не занимаюсь, с TS201 и интелом работал) Цитата Поделиться сообщением Ссылка на сообщение Поделиться на другие сайты Поделиться
Evgeny_CD 0 12 ноября, 2007 Опубликовано 12 ноября, 2007 · Жалоба .... с 4 ядерным не уверен и впринципе все зависит от правильности разводки задачи по потокам.Вот оно! Тут то мы и уперлись в ограничения процов! Про это я и говорил! В плисине "разведение по потокам" сделано разработчком. А тут - и разработчик, и ядро ОСи, и еще черт знает что влияет. Цитата Поделиться сообщением Ссылка на сообщение Поделиться на другие сайты Поделиться
mse 0 12 ноября, 2007 Опубликовано 12 ноября, 2007 · Жалоба Cyclone-III - 65нм. Мегов 400. Еще пару лет - и будет 45 нм и 600 МГц. Зато в ПЛИСине, как уже заметили, можно 100 MAC делать одновременно.Есть такое. Но DSP бывают разные. BlackFin побороть на пне можно (и то не просто - если использовать 8 битный режим), а вот старшие DSP от того же TI или AD - это врядли. Ну а FPGA вообще трудно будет побороть. Даже кластером пЫсюков. Дык, щас 1600мипсовые Блэкфины(800МГц), вроде как, то ли 0,18, то ли 0,13мкм. А ну как перейдут на 0,65? Полюбому, у ФПГА сумасшедшая избыточность. За счёт этого низкая частота и высокая стоимость. На ФПГА имеет экономический смысл реализовывать "дорогие" функции: 100-200Мсэмпловые КИХ и т.п. (скока будет стоить ФПГА с 30-50-100 18х18, каждый может посмотреть ;О) Опять-же потребление...Экстремальные задачи будут решать, а "обычные", смысла нет. Цитата Поделиться сообщением Ссылка на сообщение Поделиться на другие сайты Поделиться
anton 0 12 ноября, 2007 Опубликовано 12 ноября, 2007 · Жалоба Вот оно! Тут то мы и уперлись в ограничения процов! Про это я и говорил! В плисине "разведение по потокам" сделано разработчком. А тут - и разработчик, и ядро ОСи, и еще черт знает что влияет. Но для алгоритмов с множеством условий или просто длинных плис не оптимален, другой вопрос если не нужна плавучка алгорит не крупный (например множество согласовыных фильтров с обнаружителем) а поток данных скоростной и еще требуется небольшое время задержки и детерменированое - то другой алтернативы кроме плис нет. Насчет высокого быстродействия за низкую сумму есть еще GPU, вполне сравним с плис по быстродействию но энерго потребление ваще в космосе, и задержки на вычесление и детерменированость в отстое. :a14: Для каждой задачи есть свое оптимельное решение :beer: (: Цитата Поделиться сообщением Ссылка на сообщение Поделиться на другие сайты Поделиться
Evgeny_CD 0 12 ноября, 2007 Опубликовано 12 ноября, 2007 · Жалоба ...(скока будет стоить ФПГА с 30-50-100 18х18, каждый может посмотреть ;О)EP3C25E144C8NES - Cyclone-III, 66 умножителей, PQFP 144, 39.50 на digikey. Цитата Поделиться сообщением Ссылка на сообщение Поделиться на другие сайты Поделиться
bav 0 12 ноября, 2007 Опубликовано 12 ноября, 2007 · Жалоба Я немного знаю целочисленные DSP от TI. 64 серия - быстрая молотилка, ее на пне очень не просто объехать. Даже на 4-х ядреном. А Вы делали оптимизацию по потокам, SSE - попробуйте, удивитесь :) Основная беда всех процов - скорость обмена с внешеней памятью (по крайне мере мне приходилось упираться в это). Но дело в том, что пока я буду писать на FPGA контроллер для DDR3, разводить под него плату, появится DDR5, а то и DDR6 :( еще раз повторюсь, сравнивать DSP и FPGA это как компьютер целиком и запчасти от компютера: из запчастей можно собрать комп для и под себя, а готовым приходится пользоваться (зато нет проблем и геммороя со сборкой и настройкой). Цитата Поделиться сообщением Ссылка на сообщение Поделиться на другие сайты Поделиться
dinam 1 12 ноября, 2007 Опубликовано 12 ноября, 2007 · Жалоба Вставлю свои пять копеек, но не для развязывания спора что круче, а просто как констатация факта. У нашего программиста была возможность реализовать обработку информации с CCD линейки либо на BF-532 либо на одноядерном P4 3,4ГГц. После тестирования разница в быстродействии оказалась раз в 50, не в пользу Blackfina. Сами понимаете на чем он остановился. :) Цитата Поделиться сообщением Ссылка на сообщение Поделиться на другие сайты Поделиться
Evgeny_CD 0 12 ноября, 2007 Опубликовано 12 ноября, 2007 · Жалоба что пока я буду писать на FPGA контроллер для DDR3, разводить под него плату, появится DDR5, а то и DDR6 :(Представим картину. Вы придумали ОСь, а ОСей еще нет. И писать ОСь вы будете столько же. К счастью, осей сейчас полно, и писать их самому нет никакой необходимости. Думаю, через некоторое время ситуация с корками будет аналогичной.Вставлю свои пять копеек, но не для развязывания спора что круче, а просто как констатация факта. У нашего программиста была возможность реализовать обработку информации с CCD линейки либо на BF-532 либо на одноядерном P4 3,4ГГц. После тестирования разница в быстродействии оказалась раз в 50, не в пользу Blackfina. Сами понимаете на чем он остановился. :)Хм... занимательно! А там плавучка использовалась?А Вы делали оптимизацию по потокам, SSE - попробуйте, удивитесь :)Да я, в общем, не особо программист. :) Достаточно взглянуть на архитектуру, чтобы понять, что DSP и проц общего назначения - суть разные вещи. GUI на DSP делать довольно тоскливо, но БПФ на "общем" проце - тоже. Цитата Поделиться сообщением Ссылка на сообщение Поделиться на другие сайты Поделиться
mse 0 12 ноября, 2007 Опубликовано 12 ноября, 2007 · Жалоба EP3C25E144C8NES - Cyclone-III, 66 умножителей, PQFP 144, 39.50 на digikey. ;О) Это эквивалент TMS320C64хх с 4ГМАС, диким кол-вом памяти на борту, периферией, интерфейсами... Вдобавок, ТМС стопудово ещо будет и жрать меньше. Ну и квалификаццыя перцоналла тоже на порядок таво... ниже. Как только Ти и иже с ними почувствуют серьёзную конкуренцыю, то отставание в нанометрах будет решительно преодолено. А при равной технологии, узкозаточеный чип порвёт ФПГА как по скорости, так и по потреблению, так и по цене. НО! Полюбому 100 200-МГц умножителей-сумматоров ФПГА в пиковой своей загрузке будут быстрее 10 2000МГц МАС-ов ДСП. Тут ДСП отдохнёт нипадецки. Но это надо такую загрузку ещо найти... В общем спор из серии Ц vs ASM. ;О) Цитата Поделиться сообщением Ссылка на сообщение Поделиться на другие сайты Поделиться
Evgeny_CD 0 12 ноября, 2007 Опубликовано 12 ноября, 2007 · Жалоба В общем спор из серии Ц vs ASM. ;О)В общем, аналогия верная! :beer: Цитата Поделиться сообщением Ссылка на сообщение Поделиться на другие сайты Поделиться
blackfin 23 12 ноября, 2007 Опубликовано 12 ноября, 2007 · Жалоба Сами понимаете на чем он остановился. :) Я, например, не уверен, что понимаю. То есть, если стоит задача обработки данных с максимамальным энергопотреблением, с максимальной стоимостью и при максимальных габаритах, то да, здесь P4 вне конкуренции. Однако, если речь идет о портативном устройстве с питанием от аккумуляторов, то здесь, возможно, Blackfin не так уж и плох. PS. А вообще, все эти сравнения напоминают детскую игру: камень-ножницы-бумага. ;) Говорить о "векторе движения" бессмысленно. ИМХО, тензорный анализ ближе к теме. Цитата Поделиться сообщением Ссылка на сообщение Поделиться на другие сайты Поделиться
Evgeny_CD 0 12 ноября, 2007 Опубликовано 12 ноября, 2007 · Жалоба То есть, если стоит задача обработки данных с максимамальным энергопотреблением, с максимальной стоимостью и при максимальных габаритах, то да, здесь P4 вне конкуренции.Вы просто пропели гимн x86 архитектуре Цитата Поделиться сообщением Ссылка на сообщение Поделиться на другие сайты Поделиться
dinam 1 12 ноября, 2007 Опубликовано 12 ноября, 2007 · Жалоба А там плавучка использовалась?Нет. Я, например, не уверен, что понимаю. Не совсем понял вашу иронию :). Ведь я же ясно написал что была возможность выбора, значит все остальные описываемые ваши максимальные величины не имели значения. Цитата Поделиться сообщением Ссылка на сообщение Поделиться на другие сайты Поделиться