Перейти к содержанию
    

...В то же время для более "земных" задач - "обычные" процессоры на деле почти догнали DSP (а при большой разрядности - и перегнали), т.к. программировать их получается эффективнее.
"Обычные" процессоры "почти догнали" DSP только за счёт внедрения в их архитектуру типичных DSP-шных блоков.

А насчёт "большей эффективности их программирования" - это результат личного опыта, или плод досужих размышлений?

Конвергенция архитектур, однако, есть факт очевидный. И не стОит при этом говорить, что "обычная" чем-то лучше. Скорее, наоборот: "универсальные" ядра всё больше становятся похожими на DSP-шные. :)

ПЛИС же, имхо, не способна заменить микропроцессор вообще и DSP в частности там, где нужно реализовывать плохо параметризуемые задачи, и там, где, кроме собственно вычислений, нужно выполнять длинную и скучную работу по обслуживанию протекающих в системе процессов ввода-вывода и управления.

Процессоры вообще и DSP в частности как раз и создавались для того, чтобы заменить в ряде сложных алгоритмически задач жёсткую логику.

 

Вот это уже более корректное сравнение.
И в чём же его корректность? В сравнении производительности только на одной операции? :biggrin:

Есть такие задачи, для решения которых Вам потребуется реализовать на ПЛИС... процессор.

Иначе придётся топить помещение ПЛИСинами.

 

На задачах типа тупой фильтрации данных, не более того. На которых "задыхается" и DSP, и процессор общего назначения.
Правильно. "Не более того".

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

Сколько тактов съест у 16-битного BF sqrt (64bit) ?
Да это не важно. :)

Вы уже ответили косвенно на все вопросы:

С компьютерами и их железом я "завязал" ввиду экономической нерациональности лепить свой комп, когда есть куча готовых.
Т.е. лепить свою мегафункцию "экономически нерационально", т.е. использовать FPGA экономически оправдано только если есть готовые корки, причем бесплатно, т.е. даром. Шаг вправо, шаг влево, все - тупик. Дальше H.264 никуда..

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

...

Есть такие задачи, для решения которых Вам потребуется реализовать на ПЛИС... процессор.

...

 

Нет проблем.

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

ОК. С видео понятно. Что со звуком делать?

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

Нет проблем.
Это мне известно, и такой подход в ряде случаев оправдан. Однако, такой процессор будет хуже "нативного" по всем параметрам - быстродействию, энергопотреблению и т.д.; кроме того, никто не мешает встроить в DSP и FPGA (кто "главнее" - неясно в этом случае). Единственное (хоть и существенное) преимущество - возможность иметь всё в одном чипе.

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

Нет проблем.

 

Впринципе например в Vertex4 FX имеются готовые ядра PowerPC для большинства нудных задачь при поддержке особо кретичных в вычеслительном плане функций со стороны плис наверно хватит.

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

Да это не важно. :)

Вы уже ответили косвенно на все вопросы:

Т.е. лепить свою мегафункцию "экономически нерационально", т.е. использовать FPGA экономически оправдано только если есть готовые корки, причем бесплатно, т.е. даром. Шаг вправо, шаг влево, все - тупик. Дальше H.264 никуда..

Не приписывайте людям того, чего они не утверждали. Я говорил про невыгодность в большинстве случаев создания компьютеров, а не про написание мегафункций (при определенных условиях, оно может быть очень даже выгодным - но это должен быть либо уникальный заказ, либо гарантированный тираж).

 

Это мне известно, и такой подход в ряде случаев оправдан. Однако, такой процессор будет хуже "нативного" по всем параметрам - быстродействию, энергопотреблению и т.д.; кроме того, никто не мешает встроить в DSP и FPGA (кто "главнее" - неясно в этом случае). Единственное (хоть и существенное) преимущество - возможность иметь всё в одном чипе.

Хуже сделанного непосредственно на кремнии - только технически, но не экономически, если серия ограничена. Что лучше - реально осуществимый за разумные деньги процессор, точно "заточенный" под алгоритм и за счет этого быстро решающий задачу, несмотря на скромную тактовую, или "быстрый" процессор, который с задачей не справляется :biggrin:

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

Не приписывайте людям того, чего они не утверждали.
Вы мне несколько раз приписывали то, чего я не утвеждал, так чем же я хуже? :biggrin:

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

Впринципе например в Vertex4 FX имеются готовые ядра PowerPC для большинства нудных задачь при поддержке особо кретичных в вычеслительном плане функций со стороны плис наверно хватит.

Так я про то и говорил - что дело конфигурируемой логики - быть клеем, а стандартные блоки должны быть нормальными, а не из LE.

 

"Обычные" процессоры "почти догнали" DSP только за счёт внедрения в их архитектуру типичных DSP-шных блоков.

Ага, только "однотактный умножитель" еще чуть ли не в БЭСМ6 был :)

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

Так я про то и говорил - что дело конфигурируемой логики - быть клеем, а стандартные блоки должны быть нормальными, а не из LE.

 

Другой вопрос (и наверно основной) связан с сложностью разработки такого сендвича поскольку имеется комбинация из процессорного кода и внешнего конфигурируемого железа (про отладку проукта отдельный разговор).

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

Ага, только "однотактный умножитель" еще чуть ли не в БЭСМ6 был :)
Речь то шла о том, что тот же пентиум-4 за такт умножает восемь чисел в формате с плавающей запятой - double precision. Чем не DSP?
Изменено пользователем blackfin

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

Речь то шла о том, что тот же пентиум-4 за такт умножает восемь чисел в формате с плавающей запятой - double precision. Чем не DSP?

А кстати, да. Народ почему-то ругает Intel, мол медленные, но при устранении зависимости по данным и правильном их размещении в кэше - молотилка еще та. Главное, точная - чего изготовители DSP никак освоить не могут, даже float у них не больше 32 (т.е. значащих 24), а целые 32 - сиротливый 28 со своими 150 МГц. 400 МГц MIPS его рвет, как тузик грелку.

Изменено пользователем SIA

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

Хуже сделанного непосредственно на кремнии - только технически, но не экономически, если серия ограничена. Что лучше - реально осуществимый за разумные деньги процессор, точно "заточенный" под алгоритм и за счет этого быстро решающий задачу, несмотря на скромную тактовую, или "быстрый" процессор, который с задачей не справляется.
Простите, но в этой теме мы обсуждаем гипотетическую "смерть" DSP-шных ядер. Если ставить вопрос так, как Вы, нужно говорить о преимуществах и недостатках гибких и жёстких архитектур вообще.

С точки зрения гибкости, ФПГА и ДСП стоят на разных уровнях иерархии: ФПГА гибче на "нижнем" уровне, а ДСП в этом смысле опережает её ступенькой выше.

Я вовсе не являюсь противником ФПГА; считаю только наиболее эффективным разумное сочетание вышеозначенной гибкости на разных уровнях, если задача того требует (впрочем, это банальность), а слухи о кончине DSP - несколько преувеличенными.

Если же говорить об эффективности при массовом производстве, то здесь, несомнеенно, 100 очков вперёд FPGA даст АСИК (это тоже банальность). И далеко не каждый АСИК, по целому ряду причин, может быть прототипирован с помощью ФПГА.

 

А кстати, да. Народ почему-то ругает Intel, мол медленные, но при устранении зависимости по данным и правильном их размещении в кэше - молотилка еще та.
Ну, правильно. Почему только он называется "универсальным" процессором - непонятно. :biggrin: Наверное, только по причине тяжкого интеловского наследия.

Большая длина конвейера, кстати, для DSP-шного применения весьма плоха.

 

...Главное, точная - чего изготовители DSP никак освоить не могут, даже float у них не больше 32 (т.е. значащих 24), а целые 32 - сиротливый 28 со своими 150 МГц. 400 МГц MIPS его рвет, как тузик грелку.
Изготовители DSP ориентируются, прежде всего, на конъюнктуру рынка. А реалии его таковы, что более 32-х разрядов разработчикам практически не требуется, а наличие редких операций более высокой точности практически не увеличивает вычислительную нагрузку на ядро. Бездумное же увеличение разрядности приводит к резкому росту цены на устройство (надеюсь, не нужно пояснять, чем 64-битный однотактовый умножитель отличается от 32-битного). Всё это, конечно, верно при условии, что реализация алгоритмов сигнальной обработки осуществляется специалистами, имеющими в своём арсенале не только дельфи.

 

Речь то шла о том, что тот же пентиум-4 за такт умножает восемь чисел в формате с плавающей запятой - double precision. Чем не DSP?
Вообще-то, это делает не само процессорное ядро, а сопроцессор. И, по-моему, только 2 числа, а не 8 (хотя, здесь могу ошибаться).

И DSP - это не только умножалка. Отличительная особенность любого DSP - его шинная архитектура. Универсальным процам в этом смысле до ДСП далеко.

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

И, по-моему, только 2 числа, а не 8 (хотя, здесь могу ошибаться).
Да, пардон, виноват..

 

SSE:

MULPS xmm1,xmm2; // четыре_упакованных_single_precision * четыре_упакованных_single_precision

 

SSE-2:

MULPD xmm1,xmm2; // два_упакованных_double_precision * два_упакованных_double_precision

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

Присоединяйтесь к обсуждению

Вы можете написать сейчас и зарегистрироваться позже. Если у вас есть аккаунт, авторизуйтесь, чтобы опубликовать от имени своего аккаунта.

Гость
Ответить в этой теме...

×   Вставлено с форматированием.   Вставить как обычный текст

  Разрешено использовать не более 75 эмодзи.

×   Ваша ссылка была автоматически встроена.   Отображать как обычную ссылку

×   Ваш предыдущий контент был восстановлен.   Очистить редактор

×   Вы не можете вставлять изображения напрямую. Загружайте или вставляйте изображения по ссылке.

×
×
  • Создать...