Перейти к содержанию
    

Совместная работа нескольких FPGA

Я не имею никакого опыта и теор подготовки по этому вопросу. По профессии программист. Интересуюсь нейросетями.
На сколько я знаю, предпринимаются попытки организовать параллельные вычисления с помощью FPGA.
С другой стороны, в одном из роликов на youtube автор создает эмулятор Spectrum. Он впаивает Cyclone IV на макетную плату и дальше собирает схему.
Мой вопрос состоит из двух частей.
1. Cyclone IV реально распаивать без спец. оборудования. А Cyclone 10? Т.е. можно ли работать с современными производительными FPGA как с элементной базой, или там
возможен только вариант с dev board?
2. Как можно организовать совместную работу нескольких FPGA типа Cyclone 10 c массивом (потоком) данных? 
Есть ли практический способ соединить их через общую память. Или единственный вариант это большой круг типа
Cyclone 10 -> dev board -> Ethernet -> dev board -> Cyclone 10

Изменено пользователем cudnn

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

21 hours ago, cudnn said:

Интересуюсь нейросетями.

Не очень ясно, зачем тут фпга, и надо явно не уровня циклонов 10.

Хотя бы с этого начать https://item.taobao.com/item.htm?spm=a230r.1.14.15.7f80361cB7EwJS&id=608706046387&ns=1&abbucket=6#detail

копеечный вариант за 10ку - Ultrascale. 

Я поигрался с Coral Dev Board от гугла.. ну так себе. Правда и брал ее не для распознования кошечек.

А DEV борды нынче немодно, SOM берут. Их и в производство можно, и экономия нехилая - только малая часть общей платы будет 6..10 слоев. Хотя "экономия" и FPGA (ну те самые, на 1млн LE за $7000 чип) вещи не очень вяжущиеся.

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

очень широкая тема, то есть можно нейросеть, как на 10к$ ПЛИС реализовать, так и на 10$, но это будут разные сети:)

вот ориентированное для маленьких ПЛИС решение - тренировка сети делается на ПК, а на маленькой ПЛИС работает распознавалка с уже полученными коэффициентами/весами 

https://www.latticesemi.com/sensAI

насколько я понимаю (вообще не разбираясь в этой нейросетевой деятельности) в этой реализации уровни сети реализованны в виде автоматов, требуют много тактов для вычисления

предположу, что и у Альтеры есть похожее.

-------------------

по поводу пайки - сейчас трудно найти ПЛИС в не BGA корпусе (циклон 4, уже весьма устаревший, это наверно последнее в qfp корпусе - больше по логике в таких корпусах и не выпускают сейчас), поэтому впаять их в домашних условиях тяжело, но трудолюбивые китайцы предлагают  различные SOM платы - то есть там плисина уже запаяна, и на свою "радиолюбительскую" плату нужно запаять только разъем

с масштабированием ПЛИС, тем более в "исследовательском" проекте, всегда лучше взять вдвое большую ПЛИС, чем две вдвое меньше и вдвое дешевле (и по деньгам и по нервам будет в 90% случаев дешевле)

ну и вообще, моя рекомендация - вначале на симуляторе посмотреть, как это будет работать, а потом уже железом заниматься. возможно, что для каких-то огромных по вычислительным ресурсам проектам симулятор не поможет, но предположу, что для таких проектов GPU будет гораздо реальнее, чем ПЛИС

 

 

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

Нет, не предпринимаются. Это кошмарно неэкономичное решение. Видеокарты уже идеально оптимизированы под задачу.

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

12 hours ago, rkit said:

Нет, не предпринимаются. Это кошмарно неэкономичное решение. Видеокарты уже идеально оптимизированы под задачу.

ну а гуглевский TPU уже упоминавшийся выше? есть какой-то китайский процессор (доступный с али и видел в конфе упоминания). я так понимаю, что и железо и большая часть софта для них закрыта - есть некое API для управляющей машинки и все.. (? так)

если что-то такое самому разрабатывать, то ПЛИС идеальный вариант для обкатки, по-моему

GPU выигрывает потому, что уже готовое и дешевле, но если есть деньги и/или время - почему бы не попытаться...

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

1 hour ago, yes said:

ну а гуглевский TPU уже упоминавшийся выше? есть какой-то китайский процессор (доступный с али и видел в конфе упоминания). я так понимаю, что и железо и большая часть софта для них закрыта - есть некое API для управляющей машинки и все.. (? так)

если что-то такое самому разрабатывать, то ПЛИС идеальный вариант для обкатки, по-моему

GPU выигрывает потому, что уже готовое и дешевле, но если есть деньги и/или время - почему бы не попытаться...

так речь для всех этих гугл TPU, Kendryte K210 и т д - сделать АИ - встраиваемым. Видяху то не особо встроишь. 

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

14 minutes ago, DASM said:

Видяху то не особо встроишь.

Встраивают - Jetson Nano, Jetson AGX Xavier

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

30 minutes ago, xvr said:

Встраивают - Jetson Nano, Jetson AGX Xavier

'это и будет TPU. Таже фигня Amlogic 310 - 5 TOPS , хотя проц общего назначения. Модно счас это встраивать. Но под видяхой чаще имееется в виду пси-е карточка.

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

1 hour ago, DASM said:

так речь для всех этих гугл TPU, Kendryte K210 и т д - сделать АИ - встраиваемым. Видяху то не особо встроишь. 

я этим интересуюсь совсем со стороны - дальше чем tensorflow на ПК погонять не углублялся, но кажется, что "встраиваемый" в этом случае означает: "не в облачном сервисе", поэтому и видяху можно... но, например, Латтис в своем "АИ для бедных" считает милливатты, то есть, я уверен, АИ во всяких "умных вещах" попрет и если туда влезать, то надо уже сейчас... ну и если чип для такого АИ делать, то наверно в 500-1000 баксовом ультраскейле его обкатать можно (но опять же - это необоснованное оценочное мнение :)

 

 

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

не, теперь уже имеется в виду в каждом дроне с самонаведением и пулеметом

4 minutes ago, yes said:

то наверно в 500-1000 баксовом ультраскейле его обкатать можно (но опять же - это необоснованное оценочное мнение :)

каком именно? Я выше ссыль давал на 150 баков плату, она на AI и позицинируется. Вероятно есть и примеры какие-то (скоро получу - посмотрю).  

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

то что можно поиметь как пользователь готовой коробочки, менее интересно, чем быть владельцем такого IP. хотя если знать нишу, то и Kendryte подойдет...

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

6 hours ago, yes said:

если есть деньги и/или время - почему бы не попытаться... 

Нет, ну понятно, что наш программист, у которого нет ресурсов запаять BGA, сделает лучше например интела, который не осилил обогнать видеокарты на своих FPGA.

 

4 hours ago, DASM said:

'это и будет TPU. Таже фигня Amlogic 310 - 5 TOPS , хотя проц общего назначения. Модно счас это встраивать. Но под видяхой чаще имееется в виду пси-е карточка. 

Вполне сойдет и встроенная, какая есть в любом процессоре для мобилок.

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

18 hours ago, DASM said:

каком именно? Я выше ссыль давал на 150 баков плату, она на AI и позицинируется. Вероятно есть и примеры какие-то (скоро получу - посмотрю).  

это уже с готовым чипом от гугля(?), на али, наверно и за 15 можно купить модуль с K210 или похожим.

а если разрабатывать какой-то чип/IP аналог, то какой-нибудь кинтекс XCKU040 (он на дев. борде KCU105 за 3к - для нескольких штук делать свою плату дороже выдет). из-за масштабируемости можно и на каких-то совсем дешевых латтисах/айсах и т.п. или же на симуляторе отработать, но чтобы показывать типа "венчурным инвесторам" в реальном времени, а не прув.

сейчас, кажется, что такое время, что уже понятно "это работает" и софт есть, а железа пока мало (возможно, что клепают вовсю и скоро завалят такими чипами, но пока нет). то есть можно проскочить, а если успеть в уходящий поезд импортозамещения, то совсем хорошо

ну это все в рамках фантазий я пишу, но вот если бы делать нечего было - то кажется наиболее интересной эта тема

 

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

Не, с чипом от Гугля это Coral Dev board, тоже 150 уе. А то - кит на ультраскале, который китайцы прчему то AI считают и 1.2 tops как-то вывели. 

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

Присоединяйтесь к обсуждению

Вы можете написать сейчас и зарегистрироваться позже. Если у вас есть аккаунт, авторизуйтесь, чтобы опубликовать от имени своего аккаунта.

Гость
Ответить в этой теме...

×   Вставлено с форматированием.   Вставить как обычный текст

  Разрешено использовать не более 75 эмодзи.

×   Ваша ссылка была автоматически встроена.   Отображать как обычную ссылку

×   Ваш предыдущий контент был восстановлен.   Очистить редактор

×   Вы не можете вставлять изображения напрямую. Загружайте или вставляйте изображения по ссылке.

×
×
  • Создать...