Перейти к содержанию
    

Откуда такая производительность у UltraScale+.

Добрый день.

Посмотрел производительность Kintex UltraScale по сравнению с Virtex 7, Virtex 6 на примере FFT, RS, Viterbi.

Оказался он производительнее, вроде так и должно быть (Slice другие, 20 nm и т. д.), но потом посмтрел на Ultra Scale + и обомлел.

______________________|FFT (8192, Str, Unscale)____|____ReedSolomon (CCSDS)_____|____DecoderViterbi

Virtex 6, МГц____________|______290 (V 7.1) ________|__________266 _____________|______316

Virtex 7, МГц____________|______281_______________|__________265 ____________|______ 303

Kintex UltraScale, МГц ____|______303_______________|__________347 _____________|______358

Kintex UltraScale+, МГц_|______571_______________|__________494 _____________|______538

 

Kintex UltraScale+ RS ATSC так вообще 1019 МГц. 8-)

Это что за волшебство?

UltraScale+ действительно такой хороший или для него приведены абстрактные МГц в вакууме?

Проясните пожалуйста.

 

https://www.xilinx.com/support/documentatio...on/ru/xfft.html

https://www.xilinx.com/support/documentatio...rs-encoder.html

https://www.xilinx.com/support/documentatio...ru/viterbi.html

 

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

За 1019 не поручусь, но

 

>Kintex UltraScale+, МГц_|______571_______________|__________494 _____________|______538

 

вообще обычное дело даже для не-UltraScale.

 

Если CLB будет на 1 ГГц, то почему нет.

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

вообще обычное дело даже для не-UltraScale.

 

Вы не так поняли. Это частоты для конкрентных IP блоков, а для не UltrScale они тоже приведены.

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

Для не UltraScale частоты низкие, потому что код внутри IP трешовый. Мало этапов у конвейера. Больше этапов - больше частота...

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

Для не UltraScale частоты низкие, потому что код внутри IP трешовый. Мало этапов у конвейера. Больше этапов - больше частота...

Есть какие-нибудь, хоть косвенные подтверждения этому? Там в принципе одна и та же версия корки должна быть для сравнения использована, да и можно самому попробовать проверить одно ядро на разных семействах. Цифры интересные.

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

Есть какие-нибудь, хоть косвенные подтверждения этому? Там в принципе одна и та же версия корки должна быть для сравнения использована, да и можно самому попробовать проверить одно ядро на разных семействах. Цифры интересные.

Там внутри корки могут быть различия для разных семейств, поэтому и собирается эта корка по-разному, о чём нам какбэ намекает различное количество ресурса для одной и той же корки при разных типах ПЛИС.

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

Так они же на 11нм техпроцессе, вроде, - вот и растёт быстродействие и объём.

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

Там внутри корки могут быть различия для разных семейств, поэтому и собирается эта корка по-разному, о чём нам какбэ намекает различное количество ресурса для одной и той же корки при разных типах ПЛИС.

 

Возьмем для сравнения

xcku13p     ffve900     -1     kup_1_testmeasurement_stream_fixed     1     8192     pipelined_streaming_io     false     fixed_point     24     24     unscaled     convergent_rounding     natural_order     false     aclk     571     5803     10605     3582     40     3     63     ADVANCE 1.05 07-08-2016
xcku115     flva1517     -1     ku_1_testmeasurement_stream_fixed     1     8192     pipelined_streaming_io     false     fixed_point     24     24     unscaled     convergent_rounding     natural_order     false     aclk     303     5873     10605     3595     40     3     63     PRODUCTION 1.23 09-23-2016

xcku13p     ffve900     -1     kup_1_testmeasurement_stream_float     1     8192     pipelined_streaming_io     false     floating_point     32     24             natural_order     false     aclk     440     7103     11818     4716     45     3     97     ADVANCE 1.05 07-08-2016
xcku115     flva1517     -1     ku_1_testmeasurement_stream_float     1     8192     pipelined_streaming_io     false     floating_point     32     24             natural_order     false     aclk     303     7154     11818     4750     45     3     97     PRODUCTION 1.23 09-23-2016

 

Не сильно по ресурсам отличаются, в пределах разброса оптимизации, а по скорости разница существенная - 571 МГц вместо 303 МГц, или 440 МГц вместо 303 МГц. При этом в скорости отдельно взятых примитивов такой разницы не видно. Может причина кроется в увеличении ресурсов роутинга? Предположим добавили триггеры на межсоединениях, как у Альтеры.

 

 

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

Так они же на 11нм техпроцессе, вроде, - вот и растёт быстродействие и объём.

Innovations at 16nm: UltraScale+ Family.

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

Так они же на 11нм техпроцессе, вроде, - вот и растёт быстродействие и объём.

 

16 нм. Уменьшили на 20%, а скорость более 50%?

Virtex 6 - 40 nm

Virtex 7 - 26 nm.

Уменьшили на на 35%, а где прирост скорости?

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

Значит на 16нм, лень смотреть точно было.

Видимо откладывали прирост до выхода UltraScale+.

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

там кроме перехода на 16нм еще

UltraScale™ architecture-based All Programmable FPGAs, 3D ICs and SoCs

 

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

там кроме перехода на 16нм еще

3D есть даже в Virtex 7 и в кристаллах Kintex UltraScale для которых приведены рабочии частота.

Это не объясняет столь колоссальный отрыв UltraScale+, от UltraScale.

 

https://www.xilinx.com/products/silicon-devices/3dic.html

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

16nm - Finfet TSMC 16FF+

20nm+ - Planar

 

У FinFet сопротивление канала и утечки меньше.

 

http://www.tsmc.com/english/dedicatedFound...nology/16nm.htm

http://www.tsmc.com/english/dedicatedFound...nology/20nm.htm

http://www.tsmc.com/english/dedicatedFound...nology/28nm.htm

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

Есть какие-нибудь, хоть косвенные подтверждения этому? Там в принципе одна и та же версия корки должна быть для сравнения использована, да и можно самому попробовать проверить одно ядро на разных семействах. Цифры интересные.

 

Kintex UltraScale, МГц ____|______303_______________|__________347 _____________|______358

 

Частоты около 300 означают, что оптимизации проекта в целом никакого внимания не уделялось.

Кто собирал, как собирал, из чего ... и что хотел сказать этим автор.

 

 

 

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

Присоединяйтесь к обсуждению

Вы можете написать сейчас и зарегистрироваться позже. Если у вас есть аккаунт, авторизуйтесь, чтобы опубликовать от имени своего аккаунта.

Гость
Ответить в этой теме...

×   Вставлено с форматированием.   Вставить как обычный текст

  Разрешено использовать не более 75 эмодзи.

×   Ваша ссылка была автоматически встроена.   Отображать как обычную ссылку

×   Ваш предыдущий контент был восстановлен.   Очистить редактор

×   Вы не можете вставлять изображения напрямую. Загружайте или вставляйте изображения по ссылке.

×
×
  • Создать...