Откуда такая производительность у UltraScale+.

Ответить

Tpeck 0

16 ноября, 2016

Опубликовано 16 ноября, 2016 · Жалоба

Добрый день.

Посмотрел производительность Kintex UltraScale по сравнению с Virtex 7, Virtex 6 на примере FFT, RS, Viterbi.

Оказался он производительнее, вроде так и должно быть (Slice другие, 20 nm и т. д.), но потом посмтрел на Ultra Scale + и обомлел.

______________________|FFT (8192, Str, Unscale)____|____ReedSolomon (CCSDS)_____|____DecoderViterbi

Virtex 6, МГц____________|______290 (V 7.1) ________|__________266 _____________|______316

Virtex 7, МГц____________|______281_______________|__________265 ____________|______ 303

Kintex UltraScale, МГц ____|______303_______________|__________347 _____________|______358

Kintex UltraScale+, МГц_|______571_______________|__________494 _____________|______538

Kintex UltraScale+ RS ATSC так вообще 1019 МГц. 8-)

Это что за волшебство?

UltraScale+ действительно такой хороший или для него приведены абстрактные МГц в вакууме?

Проясните пожалуйста.

https://www.xilinx.com/support/documentatio...on/ru/xfft.html

https://www.xilinx.com/support/documentatio...rs-encoder.html

https://www.xilinx.com/support/documentatio...ru/viterbi.html

Цитата

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

jojo 0

16 ноября, 2016

Опубликовано 16 ноября, 2016 · Жалоба

За 1019 не поручусь, но

>Kintex UltraScale+, МГц_|______571_______________|__________494 _____________|______538

вообще обычное дело даже для не-UltraScale.

Если CLB будет на 1 ГГц, то почему нет.

Цитата

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

Tpeck 0

16 ноября, 2016

Опубликовано 16 ноября, 2016 · Жалоба

вообще обычное дело даже для не-UltraScale.

Вы не так поняли. Это частоты для конкрентных IP блоков, а для не UltrScale они тоже приведены.

Цитата

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

jojo 0

16 ноября, 2016

Опубликовано 16 ноября, 2016 · Жалоба

Для не UltraScale частоты низкие, потому что код внутри IP трешовый. Мало этапов у конвейера. Больше этапов - больше частота...

Цитата

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

Dimidrol 0

16 ноября, 2016

Опубликовано 16 ноября, 2016 · Жалоба

Для не UltraScale частоты низкие, потому что код внутри IP трешовый. Мало этапов у конвейера. Больше этапов - больше частота...

Есть какие-нибудь, хоть косвенные подтверждения этому? Там в принципе одна и та же версия корки должна быть для сравнения использована, да и можно самому попробовать проверить одно ядро на разных семействах. Цифры интересные.

Цитата

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

Bad0512 2

17 ноября, 2016

Опубликовано 17 ноября, 2016 · Жалоба

Есть какие-нибудь, хоть косвенные подтверждения этому? Там в принципе одна и та же версия корки должна быть для сравнения использована, да и можно самому попробовать проверить одно ядро на разных семействах. Цифры интересные.

Там внутри корки могут быть различия для разных семейств, поэтому и собирается эта корка по-разному, о чём нам какбэ намекает различное количество ресурса для одной и той же корки при разных типах ПЛИС.

Цитата

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

Vascom 0

17 ноября, 2016

Опубликовано 17 ноября, 2016 · Жалоба

Так они же на 11нм техпроцессе, вроде, - вот и растёт быстродействие и объём.

Цитата

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

rloc 43

17 ноября, 2016

Опубликовано 17 ноября, 2016 · Жалоба

Там внутри корки могут быть различия для разных семейств, поэтому и собирается эта корка по-разному, о чём нам какбэ намекает различное количество ресурса для одной и той же корки при разных типах ПЛИС.

Возьмем для сравнения

xcku13p     ffve900     -1     kup_1_testmeasurement_stream_fixed     1     8192     pipelined_streaming_io     false     fixed_point     24     24     unscaled     convergent_rounding     natural_order     false     aclk     571     5803     10605     3582     40     3     63     ADVANCE 1.05 07-08-2016
xcku115     flva1517     -1     ku_1_testmeasurement_stream_fixed     1     8192     pipelined_streaming_io     false     fixed_point     24     24     unscaled     convergent_rounding     natural_order     false     aclk     303     5873     10605     3595     40     3     63     PRODUCTION 1.23 09-23-2016

xcku13p     ffve900     -1     kup_1_testmeasurement_stream_float     1     8192     pipelined_streaming_io     false     floating_point     32     24             natural_order     false     aclk     440     7103     11818     4716     45     3     97     ADVANCE 1.05 07-08-2016
xcku115     flva1517     -1     ku_1_testmeasurement_stream_float     1     8192     pipelined_streaming_io     false     floating_point     32     24             natural_order     false     aclk     303     7154     11818     4750     45     3     97     PRODUCTION 1.23 09-23-2016

Не сильно по ресурсам отличаются, в пределах разброса оптимизации, а по скорости разница существенная - 571 МГц вместо 303 МГц, или 440 МГц вместо 303 МГц. При этом в скорости отдельно взятых примитивов такой разницы не видно. Может причина кроется в увеличении ресурсов роутинга? Предположим добавили триггеры на межсоединениях, как у Альтеры.

Цитата

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

blackfin 16

17 ноября, 2016

Опубликовано 17 ноября, 2016 · Жалоба

Так они же на 11нм техпроцессе, вроде, - вот и растёт быстродействие и объём.

Innovations at 16nm: UltraScale+ Family.

Цитата

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

Tpeck 0

17 ноября, 2016

Опубликовано 17 ноября, 2016 · Жалоба

Так они же на 11нм техпроцессе, вроде, - вот и растёт быстродействие и объём.

16 нм. Уменьшили на 20%, а скорость более 50%?

Virtex 6 - 40 nm

Virtex 7 - 26 nm.

Уменьшили на на 35%, а где прирост скорости?

Цитата

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

Vascom 0

17 ноября, 2016

Опубликовано 17 ноября, 2016 · Жалоба

Значит на 16нм, лень смотреть точно было.

Видимо откладывали прирост до выхода UltraScale+.

Цитата

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

Maverick_ 15

17 ноября, 2016

Опубликовано 17 ноября, 2016 · Жалоба

там кроме перехода на 16нм еще

UltraScale™ architecture-based All Programmable FPGAs, 3D ICs and SoCs

Цитата

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

Tpeck 0

17 ноября, 2016

Опубликовано 17 ноября, 2016 · Жалоба

там кроме перехода на 16нм еще

3D есть даже в Virtex 7 и в кристаллах Kintex UltraScale для которых приведены рабочии частота.

Это не объясняет столь колоссальный отрыв UltraScale+, от UltraScale.

https://www.xilinx.com/products/silicon-devices/3dic.html

Цитата

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

jks 0

17 ноября, 2016

Опубликовано 17 ноября, 2016 · Жалоба

16nm - Finfet TSMC 16FF+

20nm+ - Planar

У FinFet сопротивление канала и утечки меньше.

http://www.tsmc.com/english/dedicatedFound...nology/16nm.htm

http://www.tsmc.com/english/dedicatedFound...nology/20nm.htm

http://www.tsmc.com/english/dedicatedFound...nology/28nm.htm

Цитата

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

jojo 0

17 ноября, 2016

Опубликовано 17 ноября, 2016 · Жалоба

Есть какие-нибудь, хоть косвенные подтверждения этому? Там в принципе одна и та же версия корки должна быть для сравнения использована, да и можно самому попробовать проверить одно ядро на разных семействах. Цифры интересные.

Kintex UltraScale, МГц ____|______303_______________|__________347 _____________|______358

Частоты около 300 означают, что оптимизации проекта в целом никакого внимания не уделялось.

Кто собирал, как собирал, из чего ... и что хотел сказать этим автор.

Цитата

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

Присоединяйтесь к обсуждению

Вы можете написать сейчас и зарегистрироваться позже. Если у вас есть аккаунт, авторизуйтесь, чтобы опубликовать от имени своего аккаунта.

Ответить в этой теме...

× Вставлено с форматированием. Вставить как обычный текст

Разрешено использовать не более 75 эмодзи.

× Ваша ссылка была автоматически встроена. Отображать как обычную ссылку

× Ваш предыдущий контент был восстановлен. Очистить редактор

× Вы не можете вставлять изображения напрямую. Загружайте или вставляйте изображения по ссылке.

Указать URL изображения

Подписчики 0

Tpeck 0

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

jojo 0

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

Tpeck 0

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

jojo 0

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

Dimidrol 0

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

Bad0512 2

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

Vascom 0

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

rloc 43

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

blackfin 16

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

Tpeck 0

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

Vascom 0

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

Maverick_ 15

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

Tpeck 0

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

jks 0

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

jojo 0

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

Присоединяйтесь к обсуждению

Обзор

Активность