Jump to content

    

AM5728 TI vs Jetson Nano NVIDIA

Добрый день, коллеги!

Есть кто имеющий практический опыт видеообработки на DSP и GPU?

Хочу понять, что круче: AM5728 TI или Jetson Nano NVIDIA.

 

Edited by Elsystems

Share this post


Link to post
Share on other sites

Доброе утро. Т.к. работал именно с 5728, скажу следующее:

0. На AM5728 открыта документация, включая Э3 референсных борд: IDK, GPEVM. Насчет jetson - не знаю.

1. AM5728 все же процессор "общего" назначения, что бы там ни говорили в TI. Т.е. больше подходит для одноплатников, а не для медиаобработчиков. На мой взгляд он в одном ряду с bcm, который в raspberry pi 3В+.

2. Реализованный на скорую руку плагин gstreamer в связке с OpenCL на 2-х dsp внутри 5728 имел пропускную способность порядка 20-23 кадров/с для входного 1080P потока. Делалось преобразование байер->NV12->автобаланс белого->контрастирование. Тот же плагин с на ARM ядрах: openMP + NEON обрабатывал все это дело примерно в 2 раза медленнее. Имейте ввиду, что у TI достаточно "своебразно" реализован OpenCL (ибо стандарт определяет только функции, но не их реализацию - подробнее посмотрите в гайде). Мой предварительный вывод: 1 dsp = 2 arm ядра. В принципе, можно было разогнать, но руки не дошли.

Уточните что именно у вас понимается под "видеообработкой", т.к. в большинстве случаев все зависит от объема входного видеопотока

Учитывая открытость документации TI, рекомендую ситару. Кстати, наиболее стабильными SDK оказались 03030004 и 05000015.

Share this post


Link to post
Share on other sites
On 5/20/2019 at 10:07 PM, aknd said:

Доброе утро. Т.к. работал именно с 5728, скажу следующее:

0. На AM5728 открыта документация, включая Э3 референсных борд: IDK, GPEVM. Насчет jetson - не знаю.

1. AM5728 все же процессор "общего" назначения, что бы там ни говорили в TI. Т.е. больше подходит для одноплатников, а не для медиаобработчиков. На мой взгляд он в одном ряду с bcm, который в raspberry pi 3В+.

2. Реализованный на скорую руку плагин gstreamer в связке с OpenCL на 2-х dsp внутри 5728 имел пропускную способность порядка 20-23 кадров/с для входного 1080P потока. Делалось преобразование байер->NV12->автобаланс белого->контрастирование. Тот же плагин с на ARM ядрах: openMP + NEON обрабатывал все это дело примерно в 2 раза медленнее. Имейте ввиду, что у TI достаточно "своебразно" реализован OpenCL (ибо стандарт определяет только функции, но не их реализацию - подробнее посмотрите в гайде). Мой предварительный вывод: 1 dsp = 2 arm ядра. В принципе, можно было разогнать, но руки не дошли.

Уточните что именно у вас понимается под "видеообработкой", т.к. в большинстве случаев все зависит от объема входного видеопотока

Учитывая открытость документации TI, рекомендую ситару. Кстати, наиболее стабильными SDK оказались 03030004 и 05000015.

Благодарю за ответ! Я занимаюсь задачей трекинга объектов на встраиваемом железе на 1080p со стримингом RTP H.264. На данный момент имею следующее: собственный модуль, для подстыковки камеры FCB-EV7520 Sony к процессорному модулю Phytec на AM5728; захват 1080p25; трекинг KCF+HOG с расчетом на каждом кадре; стрим RTP H.264. Но нужно развитие, нужен алгоритм типа TLD - с хорошим детектированием после длительных перекрытий объекта. На AM5728 opencv-шный TLD у меня сильно тормозит (расчет кадра 0,5...2сек.). Вот и смотрю в сторону чего то более производительного. Или же возможно за счет оптимизации можно на AM5728 выжать больше. Слышал что много зависит от правильной оптимизации кода под DSP, но на сколько например opencv-TLD оптимизирован мне неясно пока. Для Jetson Nano интересной выглядит производительность GPU 472 GFLOPS, и пишут что opencv GPU задействует. Еще вопрос - кто нибудь использовал библиотеку vlib из под Linux на AM5728? Вроде как на форуме TI пишут что это можно как то через opencl, но примера не нашел.

Share this post


Link to post
Share on other sites
On 5/23/2019 at 3:32 PM, Elsystems said:

Благодарю за ответ! Я занимаюсь задачей трекинга объектов на встраиваемом железе на 1080p со стримингом RTP H.264. На данный момент имею следующее: собственный модуль, для подстыковки камеры FCB-EV7520 Sony к процессорному модулю Phytec на AM5728; захват 1080p25; трекинг KCF+HOG с расчетом на каждом кадре; стрим RTP H.264. Но нужно развитие, нужен алгоритм типа TLD - с хорошим детектированием после длительных перекрытий объекта. На AM5728 opencv-шный TLD у меня сильно тормозит (расчет кадра 0,5...2сек.). Вот и смотрю в сторону чего то более производительного. Или же возможно за счет оптимизации можно на AM5728 выжать больше. Слышал что много зависит от правильной оптимизации кода под DSP, но на сколько например opencv-TLD оптимизирован мне неясно пока. Для Jetson Nano интересной выглядит производительность GPU 472 GFLOPS, и пишут что opencv GPU задействует. Еще вопрос - кто нибудь использовал библиотеку vlib из под Linux на AM5728? Вроде как на форуме TI пишут что это можно как то через opencl, но примера не нашел.

А где он данные берет для 472 гфлопс с такой скоростью? Или в этой задаче условный мегабайт надо 100500 пересчитывать? А то я тоже подбирал проц "по гигафлопсам", в итоге 3 гфлопс не хватило даже для звука, а уперся совсем не в флопсы ядра, а скорость памяти

Share this post


Link to post
Share on other sites
On 5/17/2019 at 7:00 PM, Elsystems said:

Добрый день, коллеги!

Есть кто имеющий практический опыт видеообработки на DSP и GPU?

Хочу понять, что круче: AM5728 TI или Jetson Nano NVIDIA.

 

 

ОГО!  так уже 3Д-чёртиков можно калякать - доки на нижнем уровне есть?   Или всё серо и уныло: блобы и user API?

Share this post


Link to post
Share on other sites
10 hours ago, __inline__ said:

блобы и user API?

блобы и user API

Share this post


Link to post
Share on other sites

Create an account or sign in to comment

You need to be a member in order to leave a comment

Create an account

Sign up for a new account in our community. It's easy!

Register a new account

Sign in

Already have an account? Sign in here.

Sign In Now