Jump to content

    
Sign in to follow this  
sast777

Потребление 28nm и 20nm ПЛИС Альтера - кто эффективнее?

Recommended Posts

Power Estimator дает обескураживающие результаты: статическое потребление новых 20nm ПЛИС больше, чем старых 28нм

 

Сравнение сопоставимых по ресурсам старых и новых ПЛИС:

 

P static для старшего 5-го Циклона (5CEFA7 - 150K LE, память 6800Kbit, 312 умножителей (18x18) ) = 0.355W

 

P static для сопоставимого по ресурсам 10-го Циклона GX (10CX150 - 150K LE, память 9500Kbit, 312 умножителей (18x18) ) = 0.733W

 

В новом семействе добавились аппаратные умножителли с плавающей запятой - все, другой СУЩЕСТВЕННОЙ разницы не видно.

 

Статическое потребление 28nm и 20nm ПЛИС - отличается в 2 раза, причем в ОБРАТНУЮ сторону !!!

 

 

Динамическое потребление - для максимально одинаковых условий беру процессора в SoC Циклона 5 и Ариа 10

ARM - одинаковые Cortex A9!

 

Power estimator только для HPS - 800MHz два ядра тестовое ПО - Stream

 

5-й Циклон 1.282W

 

10-й Ария - 1.127W

 

Power только для HPS - 800MHz два ядра тестовое ПО - Whetstone

 

5-й Циклон 0.913W

 

10-й Ария - 1.147W

 

Где ожидаемое уменьшение потребления при переходе на меньшие технологические нормы?

 

Share this post


Link to post
Share on other sites
статическое потребление новых 20nm ПЛИС больше, чем старых 28нм
Логично. Если стоит задача оптимизации по потреблениию то 20нм это не тот тех процесс на который нужно ровняться.

Причины в ухудшении утечек при уменьшении размеров транзисторов.

 

Т.е. на графике потребление - нанометры минимум уже пройден. Дальшейшее уменьшение нужно для для скорости а не для потребления.

 

Share this post


Link to post
Share on other sites
Power Estimator дает обескураживающие результаты: статическое потребление новых 20nm ПЛИС больше, чем старых 28нм

....

Где ожидаемое уменьшение потребления при переходе на меньшие технологические нормы?

 

Увеличение статического потребления с уменьшением техпроцесса - это естественное физическое свойство кремниевой микро- и наноэлектроники. Частично или полностью оно может быть компенсировано снижением напряжения питания, но в случае ~1V дипазона снижать дальше слишком трудно при сохранении рабочих частот, вот и растёт потребление.

 

 

Динамическое потребление должно падать с уменьшением техпроцесса, но тут многое зависит от оптимизации техпроцесса (изделия семейств LP) и оптимизации схемы (тут могут быть и мены типов шин, добавление функциональных блоков к ядру, увеличение кэшей и тд. и т.п.).

Edited by prostoRoman

Share this post


Link to post
Share on other sites

Н-да, явно пробел в образовании, спасибо.

Как-то предыдущие годы зависимость была однозначна (по моему) - меньше нормы, меньше ест.

 

(спец проекты под сверхмалое потребление не учитываю - типа ambiqmicro)

 

Если есть у кого под рукой (естественно, и сам погуглю) статейки по поводу техпроцессов 28-20-16-14 nm TSMC,

используемых Altera и Xilinx, именно с точки зрения MIPS/Watt?

 

C графиками :-)

 

Правильный путь - написать код и его в "Power estimator" для Арии 5 и 10 - не предлагать :-)

 

 

 

Повелся на "Up to 40% Lower Power than Previous-Generation FPGAs and SoCs"

https://www.intel.com/content/www/us/en/pro...a/arria-10.html

 

Правильно ли я понимаю - Cyclone 10GX и Arria 10SX - изготовлены по одному и тому же техпроцессу?

Правильно ли я понимаю - Cyclone V SE и Arria V SX - изготовлены по одному и тому же техпроцессу?

 

Если да, то чем объясняется разница в максимальных частотах например ARM?

 

Не попадалось ли где benchmark DMIPS/Watt ARM: Cyclone V SE, Arria V SX, Arria 10SX ?

Share this post


Link to post
Share on other sites

У Xilinx таже ситуация. По документам - Spartan6 начинается от 4мА, а Artix7 от 100мА.

 

Так что если нужно малое потребление - нужно искать альтернативы Intel и Xilinx, т.к. эти видимо пошли в сторону производительности...

Share this post


Link to post
Share on other sites
У Xilinx таже ситуация. По документам - Spartan6 начинается от 4мА, а Artix7 от 100мА.
Artix не совсем низкопотребляющее семейство.

Сравнивать нужно со Spartan 7 у него от 36мА но тоже в разы больше.

 

Share this post


Link to post
Share on other sites
У Xilinx таже ситуация. По документам - Spartan6 начинается от 4мА, а Artix7 от 100мА.

 

Так что если нужно малое потребление - нужно искать альтернативы Intel и Xilinx, т.к. эти видимо пошли в сторону производительности...

Отключать питание - не?

Не нужно искать производителя, обманувшего закон природы - можно нарваться на обман покупателя. (ток утечки ячейки SRAM побороть тяжело, нужно искать спец. семейства)

 

PS: Интел давно пошла в сторону производительности :biggrin:

Edited by prostoRoman

Share this post


Link to post
Share on other sites
... по поводу техпроцессов 28-20-16-14 nm TSMC, используемых Altera и ...

 

емнип, чипы с такими нормами Альтера делала только у Интел, а после слияния и подавно, не?

 

У плис? А потом тратить питание на их загрузку?

 

Патентуйте свой вариант.

Share this post


Link to post
Share on other sites

Батарейное питание. Алгоритм на столе протестирован на Cyclone V SX EVB (максимальный по ресурсам 5-й Циклон + ARM).

Часть обработки на Verilоg, часть на C. Обязательны и Verilog, и C.

По оценке программиста - вроде укладывается по времени. Но впритык - именно по ARM (хочется побольше памяти и/или мегагерц)

 

Был уверен, что Arria 10SX или связка Cyclone 10GX + внешний ARM даст меньшее потребление (батарея-с)

 

Запустил Power Estimator - и теперь озадачен: что же меньше съест при реализации алгоритма - Cyclon V, Arria V, либо 10-е..

 

 

Share this post


Link to post
Share on other sites

А вам нужен именно GX ? Т.е. трансиверы нужны в обязательном порядке?

Если - да, то учитывайте, что трансивер потребляет никак не меньше 5mW/Gbps/lane.

Если - нет, то берите Cyclone 10 LP.

Share this post


Link to post
Share on other sites
Обязательны и Verilog, и C.

А что у вас конкретно делается на Verilog? Мы тоже традиционно делали ПЛИС+ARM, только ARM всегда стоял отдельно, и я сейчас начинаю понимать, что при современных процессорах ПЛИС в некоторых проектах больше не нужна. Например у TI есть процессоры (AM57xx), имеющие как ядро общего назначения, так и весьма мощный DSP (и плюс ещё несколько маленьких ядер для RTOS до кучи), и я прикинул, что когда не нужна быстрая реакция на события, этот DSP всё решит запросто.

 

Share this post


Link to post
Share on other sites

Есть своя плата Ария 2 + 6678; но она мягко говоря потребляет...

Вот ищу - как уменьшить аппетит.

Со стороны FPGA смотрю на младшие из 10-х, а со стороны DSP - на 28nm 66AKxx.

(AM57xx имеют существенно отличную на 667х внутреннюю структуру, наши программеры дружно возопили "только не надо нового!!" )

И по Early Power Estimator получается, что 10GX практически не лучше 5Cxx.

Вручную набранные EPE:

100K LUT ~90% ; 200K ~90% FlipFlops, 250 RAM blocks 32x512 (50% 10GX150 и 70% 5CEMA7),

150 DSP 18x18+36 (96% 10GX150 и 96% 5CEMA7), Clock 6 Domains total 100K Fanouts; 4 PLL.

100Mhz: 5CEMA7 = 2.22W; 10GX150 = 2.014W;

200Mhz: 5CEMA7 = 3.75W; 10GX150 = 3.35W

 

Получается грустно - не следует ожидать уменьшения потребления при переходе от Циклона 5 к 10 GX.

Share this post


Link to post
Share on other sites

Выскажу капитанскую мысль, но тем не менее:

чем меньше техпроцесс, тем больше статика. Но меньше динамика.

Поэтому правильная стратегия при переходе на топовые семейства это уменьшать ресурсы (т.е. размер ПЛИС) и поднимать частоту.

 

Например, уменьшить кол-во ресурсов в два раза и поднять частоту в два раза. Пропускная способность останется той же, но потреблять будет меньше.

Share this post


Link to post
Share on other sites

Я в надежде на выигрыш по динамике и сделал два EPE: ресурсы одинаковые, разница только 100MHz и 200MHz.

Результат выложил выше.

Share this post


Link to post
Share on other sites

Join the conversation

You can post now and register later. If you have an account, sign in now to post with your account.

Guest
Reply to this topic...

×   Pasted as rich text.   Paste as plain text instead

  Only 75 emoji are allowed.

×   Your link has been automatically embedded.   Display as a link instead

×   Your previous content has been restored.   Clear editor

×   You cannot paste images directly. Upload or insert images from URL.

Sign in to follow this