Jump to content

    

LPDDR2 - Cyclone 5 SoC, как правильно подключать Vref, VTT, OCT

На тестовых потоках без проблем льётся по 957 Mb/s в каждую сторону (loop).

респекты. Как, если не секрет, Вы этого добились ? У Вас linux ? jumbo фреймы ?

 

Не понял. Вообще-то, UDP живёт поверх IP. Может быть вы с TCP спутали?

Да, я имел в виду TCP/IP.

 

Полагаю, что Cortex-A9 на 800 МГц будет послабее даже старого 4-ядерного AMD на 3000 МГц. Но у него есть ПЛИС. На камере цепочка MAC-IP-UDP-... выполнена как раз на ПЛИС, процессор не загружен срочными металовками в реальном времени.

я так понимаю система зрения БП...

 

Почему нельзя? Можно. В текущей камере у нас именно так и сделано: Cyclone IV + Blackfin. Но уже давно испытываем ограничение - скоростной обмен данными между ПЛИС и процессором возможен только через внешнюю SDRAM, а прямая связь через асинхронную шину. Для управления MMR это годится, но для обмена потоками данных - нет. Из-за этого приходится слишком много реализовывать сугубо на ПЛИС, а кое-что было бы удобно перекинуть процу.

бррр. Чтобы не заниматься такой жутью, года 3 назад я накупил целый мешок китов apq8064.

Тоже мечтал про gpu.

Не срослось.

Share this post


Link to post
Share on other sites
Ну просто потому, что у нас многоканальный SDR практически полностью использует ресурсы XC7A100 и есть ещё внешний процессор.

Была идея раза в два - три увеличить число каналов и перейти на Zynq.

Не сложилось.. :biggrin:

К тому, что раздельная связка ПЛИС + процессор даёт куда большее разнообразие вариантов, нежели СнК, возражений не имею. СнК - не панацея и не решает всех задач. Я вступил в дискуссию, не согласившись с тем, что СнК - это только габарит.

 

Меня, кстати, больше волнует вопрос энергопотребления. Текущая связка циклона с фином позволяет получить весьма экономное потребление (тепловизионная камера 640х480 потребляет порядка 1 Вт), и есть некоторое сомнение, что на том же цинке (даже мелком) будет лучше. На практике проверить пока не могу.

 

Хотите сказать, что если десятый циклон в три раза дешевле, то и LE у него в три раза хуже? :biggrin:

Во сколько раз хуже, не берусь судить, подколку понимаю и принимаю. :) Но согласитесь, "классический" LE с LUT4, не так-то просто сравнивать со slice на LUT6. Они там приводят некие LCELL'ы, которых в действительности не существует, для того, чтобы как-то выразить эквивалентную ёмкость. Но это сферические LCELL'ы, имхо. Ведь структура классического LE и того же ALM у альтеры очень сильно отличается, и кроме ёмкости ещё есть быстродействие и ресурсы трассировки внутри элемента. При требованиях по скорости на дешевых ПЛИС придётся городить конвейеры, что съест ресурс... Да вы это получше меня знаете.

 

В общем, однозначного ответа нет, и более современные, быстрые и дорогие ПЛИС не во всём лучше дешёвых и медленных, иначе бы последние просто не выпускали. Всё зависит от задачи. В вашем случае не сложилось. В другой раз может сложиться. СнК дают определённое преимущество в ряде задач, и это далеко не только габарит.

Share this post


Link to post
Share on other sites
Во сколько раз хуже, не берусь судить, подколку понимаю и принимаю. :) Но согласитесь, "классический" LE с LUT4, не так-то просто сравнивать со slice на LUT6. Они там приводят некие LCELL'ы, которых в действительности не существует, для того, чтобы как-то выразить эквивалентную ёмкость. Но это сферические LCELL'ы, имхо. Ведь структура классического LE и того же ALM у альтеры очень сильно отличается, и кроме ёмкости ещё есть быстродействие и ресурсы трассировки внутри элемента. При требованиях по скорости на дешевых ПЛИС придётся городить конвейеры, что съест ресурс.

Вы, возможно, не обратили внимание, но я дал ссылку на Cyclone 10 GX:

 

IMHO, TSMC 20 nm едва ли хуже, чем TSMC 28 nm..

 

Ну и LUT там 8-ми входовой..

Share this post


Link to post
Share on other sites
респекты. Как, если не секрет, Вы этого добились ? У Вас linux ? jumbo фреймы ?

Да не, обычные стандартные фреймы (1472 байта UDP), jumbo заметного прироста не даёт, геморроя больше. Хост - да, linux, пришлось только длину буферов UDP выставить. Магии особой нет. Софт, который принимает поток, парсит протокол (там у нас с камеры поток по своему протоколу летит - видео, телеметрия, метаинформация и т.д.) и формирует уже видеокадры, писал товарищ мой на С++, моя часть оконечная. Приём собственно потока UDP он сделал на Qt сокетах. Софт у него получился кроссплатформенным, успешно работает на винде, линуксе и даже на маке запустили ради прикола - работает, блин, не тормозит! :)

 

Успех, считаю, достигнут благодаря тому, что чел хорошо понимает тему и аккуратно всё написал, хотя программа не простая - куча потоков, семафоров и прочего подобного.

 

 

я так понимаю система зрения БП...

Двухканальный прибор наблюдения с удалённым постом оператора.

Share this post


Link to post
Share on other sites

dxp что за камера, если не секрет? Что то мало потребляет, у нас под 2 ватта.

Share this post


Link to post
Share on other sites
dxp что за камера, если не секрет? Что то мало потребляет, у нас под 2 ватта.

Тепловизионная (про неё 1 Вт) - своя, на микроболометре формата 640х480@17um.

Share this post


Link to post
Share on other sites
Тепловизионная (про неё 1 Вт) - своя, на микроболометре формата 640х480@17um.

Своя вероятно дешевле, у нас подороже, из вторых флиров.

У вас 14 бит или менее?

Share this post


Link to post
Share on other sites
Своя вероятно дешевле, у нас подороже, из вторых флиров.

У вас 14 бит или менее?

Свою трудно сравнивать с покупной. :) У нас серии нет, поэтому чисто купить стороннюю было бы дешевле. Тут дело в другом: у нас камера - не отдельный компонент, а как бы базовый элемент, на котором строится и весь остальной прибор.

 

АЦП, который сигнал с матрицы берёт, да, 14-разрядный, в процессе обработки диапазон ужимается, на выходе обычно хватает 10 бит.

 

P.S. Мы, похоже, в офтоп угубились.

Share this post


Link to post
Share on other sites
Никогда не понимал людей, которые берут плису со встроенным процом. Вы же понимаете, что проц Вам достается третьесортный и по стократной цене, по сравнению с отдельно рядом стоящим ?

 

Разве что габарит ?

третьесортный или еще какой сортный, но даже дохлый 8-ой грейд на лапаке дает на двух ядрах 1ГФлопс на двойной точности (пиковая по даташитам 2.4ГФлопса). Если сравнить хотя бы с очень хорошо вылизанным и заточенным под вычисления Интел-Эдисоном (который из-за чрезмерной производительности канул в лету) то на нем я получал меньше - около 700МФлопсов (пиковая по даташитам 1.5ГФлопс). А когда у вас есть часть вычислений, которые хорошо ложатся на архитектуру плиски, а часть - на процессоре, то быстрая связка процессор-плиска просто нужна.

 

Я сейчас перетаскиваю проект архитектуры: Cyclone 5 + Intel Edison на архитектуру Cyclone 5 SoC + LPDDR2 + RGMII + SDCARD, и, вижу реально следующие достоинства:

 

1. ширину платы смог с 27мм до 21.5мм уменьшить (мне было очень критично), сильно уменьшился объем корпуса со всей электроникой и даже общая площадь платы слегка уменьшилась,

2. поднялась производительность процессора, упростилось написание и оптимизация численной части для процессора,

3. на порядки поднялась скорость обмена плиска-процессор, на порядки уменьшилась латентность таких обменов,

4. слегка уменьшилась цена компонент,

5. ожидаю, что в полтора раза упадет потребление питания.

 

Да, конечно повысился гемор по разводке, так как все самое ужасное раньше сидело внутри Интел-Эдисона, и теперь все это самому пришлось развести.

Share this post


Link to post
Share on other sites

Create an account or sign in to comment

You need to be a member in order to leave a comment

Create an account

Sign up for a new account in our community. It's easy!

Register a new account

Sign in

Already have an account? Sign in here.

Sign In Now
Sign in to follow this