Stanislav 0 16 ноября, 2007 Опубликовано 16 ноября, 2007 · Жалоба ...В то же время для более "земных" задач - "обычные" процессоры на деле почти догнали DSP (а при большой разрядности - и перегнали), т.к. программировать их получается эффективнее."Обычные" процессоры "почти догнали" DSP только за счёт внедрения в их архитектуру типичных DSP-шных блоков. А насчёт "большей эффективности их программирования" - это результат личного опыта, или плод досужих размышлений? Конвергенция архитектур, однако, есть факт очевидный. И не стОит при этом говорить, что "обычная" чем-то лучше. Скорее, наоборот: "универсальные" ядра всё больше становятся похожими на DSP-шные. :) ПЛИС же, имхо, не способна заменить микропроцессор вообще и DSP в частности там, где нужно реализовывать плохо параметризуемые задачи, и там, где, кроме собственно вычислений, нужно выполнять длинную и скучную работу по обслуживанию протекающих в системе процессов ввода-вывода и управления. Процессоры вообще и DSP в частности как раз и создавались для того, чтобы заменить в ряде сложных алгоритмически задач жёсткую логику. Вот это уже более корректное сравнение.И в чём же его корректность? В сравнении производительности только на одной операции? Есть такие задачи, для решения которых Вам потребуется реализовать на ПЛИС... процессор. Иначе придётся топить помещение ПЛИСинами. На задачах типа тупой фильтрации данных, не более того. На которых "задыхается" и DSP, и процессор общего назначения.Правильно. "Не более того". Цитата Поделиться сообщением Ссылка на сообщение Поделиться на другие сайты Поделиться
Leka 0 16 ноября, 2007 Опубликовано 16 ноября, 2007 · Жалоба Размер кадра какой? Для "старых" чипов: http://www.altera.com/products/ip/dsp/imag...as-h264mce.html Цитата Поделиться сообщением Ссылка на сообщение Поделиться на другие сайты Поделиться
blackfin 23 16 ноября, 2007 Опубликовано 16 ноября, 2007 · Жалоба Сколько тактов съест у 16-битного BF sqrt (64bit) ? Да это не важно. :) Вы уже ответили косвенно на все вопросы: С компьютерами и их железом я "завязал" ввиду экономической нерациональности лепить свой комп, когда есть куча готовых. Т.е. лепить свою мегафункцию "экономически нерационально", т.е. использовать FPGA экономически оправдано только если есть готовые корки, причем бесплатно, т.е. даром. Шаг вправо, шаг влево, все - тупик. Дальше H.264 никуда.. Цитата Поделиться сообщением Ссылка на сообщение Поделиться на другие сайты Поделиться
Leka 0 16 ноября, 2007 Опубликовано 16 ноября, 2007 · Жалоба ... Есть такие задачи, для решения которых Вам потребуется реализовать на ПЛИС... процессор. ... Нет проблем. Цитата Поделиться сообщением Ссылка на сообщение Поделиться на другие сайты Поделиться
blackfin 23 16 ноября, 2007 Опубликовано 16 ноября, 2007 · Жалоба Для "старых" чипов: http://www.altera.com/products/ip/dsp/imag...as-h264mce.html ОК. С видео понятно. Что со звуком делать? Цитата Поделиться сообщением Ссылка на сообщение Поделиться на другие сайты Поделиться
Stanislav 0 16 ноября, 2007 Опубликовано 16 ноября, 2007 · Жалоба Нет проблем.Это мне известно, и такой подход в ряде случаев оправдан. Однако, такой процессор будет хуже "нативного" по всем параметрам - быстродействию, энергопотреблению и т.д.; кроме того, никто не мешает встроить в DSP и FPGA (кто "главнее" - неясно в этом случае). Единственное (хоть и существенное) преимущество - возможность иметь всё в одном чипе. Цитата Поделиться сообщением Ссылка на сообщение Поделиться на другие сайты Поделиться
anton 0 16 ноября, 2007 Опубликовано 16 ноября, 2007 · Жалоба Нет проблем. Впринципе например в Vertex4 FX имеются готовые ядра PowerPC для большинства нудных задачь при поддержке особо кретичных в вычеслительном плане функций со стороны плис наверно хватит. Цитата Поделиться сообщением Ссылка на сообщение Поделиться на другие сайты Поделиться
SIA 0 16 ноября, 2007 Опубликовано 16 ноября, 2007 · Жалоба Да это не важно. :) Вы уже ответили косвенно на все вопросы: Т.е. лепить свою мегафункцию "экономически нерационально", т.е. использовать FPGA экономически оправдано только если есть готовые корки, причем бесплатно, т.е. даром. Шаг вправо, шаг влево, все - тупик. Дальше H.264 никуда.. Не приписывайте людям того, чего они не утверждали. Я говорил про невыгодность в большинстве случаев создания компьютеров, а не про написание мегафункций (при определенных условиях, оно может быть очень даже выгодным - но это должен быть либо уникальный заказ, либо гарантированный тираж). Это мне известно, и такой подход в ряде случаев оправдан. Однако, такой процессор будет хуже "нативного" по всем параметрам - быстродействию, энергопотреблению и т.д.; кроме того, никто не мешает встроить в DSP и FPGA (кто "главнее" - неясно в этом случае). Единственное (хоть и существенное) преимущество - возможность иметь всё в одном чипе. Хуже сделанного непосредственно на кремнии - только технически, но не экономически, если серия ограничена. Что лучше - реально осуществимый за разумные деньги процессор, точно "заточенный" под алгоритм и за счет этого быстро решающий задачу, несмотря на скромную тактовую, или "быстрый" процессор, который с задачей не справляется Цитата Поделиться сообщением Ссылка на сообщение Поделиться на другие сайты Поделиться
blackfin 23 16 ноября, 2007 Опубликовано 16 ноября, 2007 · Жалоба Не приписывайте людям того, чего они не утверждали. Вы мне несколько раз приписывали то, чего я не утвеждал, так чем же я хуже? Цитата Поделиться сообщением Ссылка на сообщение Поделиться на другие сайты Поделиться
SIA 0 16 ноября, 2007 Опубликовано 16 ноября, 2007 · Жалоба Впринципе например в Vertex4 FX имеются готовые ядра PowerPC для большинства нудных задачь при поддержке особо кретичных в вычеслительном плане функций со стороны плис наверно хватит. Так я про то и говорил - что дело конфигурируемой логики - быть клеем, а стандартные блоки должны быть нормальными, а не из LE. "Обычные" процессоры "почти догнали" DSP только за счёт внедрения в их архитектуру типичных DSP-шных блоков. Ага, только "однотактный умножитель" еще чуть ли не в БЭСМ6 был :) Цитата Поделиться сообщением Ссылка на сообщение Поделиться на другие сайты Поделиться
anton 0 16 ноября, 2007 Опубликовано 16 ноября, 2007 · Жалоба Так я про то и говорил - что дело конфигурируемой логики - быть клеем, а стандартные блоки должны быть нормальными, а не из LE. Другой вопрос (и наверно основной) связан с сложностью разработки такого сендвича поскольку имеется комбинация из процессорного кода и внешнего конфигурируемого железа (про отладку проукта отдельный разговор). Цитата Поделиться сообщением Ссылка на сообщение Поделиться на другие сайты Поделиться
blackfin 23 16 ноября, 2007 Опубликовано 16 ноября, 2007 (изменено) · Жалоба Ага, только "однотактный умножитель" еще чуть ли не в БЭСМ6 был :) Речь то шла о том, что тот же пентиум-4 за такт умножает восемь чисел в формате с плавающей запятой - double precision. Чем не DSP? Изменено 16 ноября, 2007 пользователем blackfin Цитата Поделиться сообщением Ссылка на сообщение Поделиться на другие сайты Поделиться
SIA 0 16 ноября, 2007 Опубликовано 16 ноября, 2007 (изменено) · Жалоба Речь то шла о том, что тот же пентиум-4 за такт умножает восемь чисел в формате с плавающей запятой - double precision. Чем не DSP? А кстати, да. Народ почему-то ругает Intel, мол медленные, но при устранении зависимости по данным и правильном их размещении в кэше - молотилка еще та. Главное, точная - чего изготовители DSP никак освоить не могут, даже float у них не больше 32 (т.е. значащих 24), а целые 32 - сиротливый 28 со своими 150 МГц. 400 МГц MIPS его рвет, как тузик грелку. Изменено 16 ноября, 2007 пользователем SIA Цитата Поделиться сообщением Ссылка на сообщение Поделиться на другие сайты Поделиться
Stanislav 0 16 ноября, 2007 Опубликовано 16 ноября, 2007 · Жалоба Хуже сделанного непосредственно на кремнии - только технически, но не экономически, если серия ограничена. Что лучше - реально осуществимый за разумные деньги процессор, точно "заточенный" под алгоритм и за счет этого быстро решающий задачу, несмотря на скромную тактовую, или "быстрый" процессор, который с задачей не справляется.Простите, но в этой теме мы обсуждаем гипотетическую "смерть" DSP-шных ядер. Если ставить вопрос так, как Вы, нужно говорить о преимуществах и недостатках гибких и жёстких архитектур вообще. С точки зрения гибкости, ФПГА и ДСП стоят на разных уровнях иерархии: ФПГА гибче на "нижнем" уровне, а ДСП в этом смысле опережает её ступенькой выше. Я вовсе не являюсь противником ФПГА; считаю только наиболее эффективным разумное сочетание вышеозначенной гибкости на разных уровнях, если задача того требует (впрочем, это банальность), а слухи о кончине DSP - несколько преувеличенными. Если же говорить об эффективности при массовом производстве, то здесь, несомнеенно, 100 очков вперёд FPGA даст АСИК (это тоже банальность). И далеко не каждый АСИК, по целому ряду причин, может быть прототипирован с помощью ФПГА. А кстати, да. Народ почему-то ругает Intel, мол медленные, но при устранении зависимости по данным и правильном их размещении в кэше - молотилка еще та.Ну, правильно. Почему только он называется "универсальным" процессором - непонятно. Наверное, только по причине тяжкого интеловского наследия. Большая длина конвейера, кстати, для DSP-шного применения весьма плоха. ...Главное, точная - чего изготовители DSP никак освоить не могут, даже float у них не больше 32 (т.е. значащих 24), а целые 32 - сиротливый 28 со своими 150 МГц. 400 МГц MIPS его рвет, как тузик грелку.Изготовители DSP ориентируются, прежде всего, на конъюнктуру рынка. А реалии его таковы, что более 32-х разрядов разработчикам практически не требуется, а наличие редких операций более высокой точности практически не увеличивает вычислительную нагрузку на ядро. Бездумное же увеличение разрядности приводит к резкому росту цены на устройство (надеюсь, не нужно пояснять, чем 64-битный однотактовый умножитель отличается от 32-битного). Всё это, конечно, верно при условии, что реализация алгоритмов сигнальной обработки осуществляется специалистами, имеющими в своём арсенале не только дельфи. Речь то шла о том, что тот же пентиум-4 за такт умножает восемь чисел в формате с плавающей запятой - double precision. Чем не DSP?Вообще-то, это делает не само процессорное ядро, а сопроцессор. И, по-моему, только 2 числа, а не 8 (хотя, здесь могу ошибаться). И DSP - это не только умножалка. Отличительная особенность любого DSP - его шинная архитектура. Универсальным процам в этом смысле до ДСП далеко. Цитата Поделиться сообщением Ссылка на сообщение Поделиться на другие сайты Поделиться
blackfin 23 16 ноября, 2007 Опубликовано 16 ноября, 2007 · Жалоба И, по-моему, только 2 числа, а не 8 (хотя, здесь могу ошибаться). Да, пардон, виноват.. SSE: MULPS xmm1,xmm2; // четыре_упакованных_single_precision * четыре_упакованных_single_precision SSE-2: MULPD xmm1,xmm2; // два_упакованных_double_precision * два_упакованных_double_precision Цитата Поделиться сообщением Ссылка на сообщение Поделиться на другие сайты Поделиться