Перейти к содержанию
    

Чем заменить Intel Edison?

В самом деле, не понятно, чем таким незаменим этот процессор, кроме потребления.

только тем, что можно 500-800МФлоп/с на двойной точности и стандартном x86 получать ну и памятью в 1ГБ. Так бы не думал и взял бы любой контроллер, но три миллиона строк кода туда не лезут, а часто и не компилятся на архитектурах отличных от стандартных x86 или жирных армов (на A15 еле-еле собрал, на pcduino A13 не смог).

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

Вы бы оставили при себе свои домыслы. И не ссылались на гугл, как на авторитет в данной области wink.gif

Понятно :biggrin:Больше к вам вопросов не имею- ваше повсеместное и тотальное незнание вопроса очевидно, смысла разводить дискуссию и загаживать тему не вижу.

 

По теме- кроме усб 3 я бы еще посмотрел на тандерболт.

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

Понятно :biggrin:Больше к вам вопросов не имею- ваше повсеместное и тотальное незнание вопроса очевидно...

Я в ваших оценках собственных знаний не нуждаюсь. Прекратите загаживать тему.

 

 

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

Я в ваших оценках собственных знаний не нуждаюсь.

Да было бы что оценивать :laughing:

только тем, что можно 500-800МФлоп/с на двойной точности и стандартном x86 получать ну и памятью в 1ГБ. Так бы не думал и взял бы любой контроллер, но три миллиона строк кода туда не лезут, а часто и не компилятся на архитектурах отличных от стандартных x86 или жирных армов (на A15 еле-еле собрал, на pcduino A13 не смог).

Совсем забыл- пеньки и целероны тоже подходят, в смысле новые(той же генерации что и Atom E3900). Можете купить одноплатник соответствующий.

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

Совсем забыл- пеньки и целероны тоже подходят, в смысле новые(той же генерации что и Atom E3900). Можете купить одноплатник соответствующий.

и в тех же габаритах и с более-менее рабочим SPI или еще каким синхронным интерфесом до плиски? Если да, дайте, пожалуйста ссылку.

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

и в тех же габаритах и с более-менее рабочим SPI или еще каким синхронным интерфесом до плиски? Если да, дайте, пожалуйста ссылку.

Так а зачем плис еще? Если есть обработка которая плохо ложится на х86, поставьте GPU- если это чересчур то возьмите какой-нибудь модуль на новых ZYNQ (EG). Опять же, есть Jetson TX2.

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

... Пивовары и виноделы меня сразу пошлют подальше!

Пивовары и виноделы вас и так пошлют подальше. Им нужен достоверный количественный анализ - концентрация конкретного вещества в продукте. У вас пока нет даже достоверного качественного анализа - на уровне есть/нет. Это не мои оценки, а специалистов - ваших коллег, которых я попросил познакомиться с вашей разработкой. Все это пока на уровне лабораторных экспериментов. До коммерческого использования - как до Луны пешком.

 

 

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

Так а зачем плис еще? Если есть обработка которая плохо ложится на х86, поставьте GPU- если это чересчур то возьмите какой-нибудь модуль на новых ZYNQ (EG). Опять же, есть Jetson TX2.

цикл обработки данных от прихода до принятия решения - 100микросекунд, за которые на плиске делается примерно 4 миллиона вычислений и на х86 еще около 3к. ГПУшка обычно за это время успеет (если повезет) загрузить свое ядро, а еще туда надо кинуть данные, которые только что появились на плиске, и, не забыть обработать... Да, 40ГФлопс на ГПУ - в общем копейки и реально на раз делается, но не в реальном времени, а с конской задержкой и трафиком в 640МБайт/с.

 

Да и Jetson TX2 не сильно по архитектуре от других ГПУ отличается, как я говорил, суть в том, что есть две части алгоритма, одна хорошо параллелится и требует все данные с сенсора и кучу флопов, а другая практически скалярна и не параллелится, и требует мало флопов, но все должно успеть за 100мкс, иначе снимать данных придется раз так в 20 больше, то есть в 20 раз дольше проводить измерения. Для многих задач - это становится неприемлемо.

 

Это не мои оценки, а специалистов - ваших коллег, которых я попросил познакомиться с вашей разработкой.

Смотрите, если кто и пытался ознакомиться, то писал мне, я посылал ему какие спектры получаю. Обычно люди после этого говорили не в таком тоне, как вы. И опять же интересно, откуда вы взяли, что есть только качественный анализ, додумались, статьи мои почитали, тогда покажите где там это написано? Просто интересно! А ваши специалисты-то хоть раз в глаза ЯМР спектрометр видели и на нем работали?

Пивовары и виноделы вас и так пошлют подальше.

А вот вы конкретно с ними лично на эту тему разговаривали? Я - да, и высказанное мне лично мнение пивоваров И виноделов той страны, где я живу, отличается от того, что вы сказали, наверное на это у них тоже есть какие-то причины, не так ли?

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

цикл обработки данных от прихода до принятия решения - 100микросекунд, за которые на плиске делается примерно 4 миллиона вычислений и на х86 еще около 3к. ГПУшка обычно за это время успеет (если повезет) загрузить свое ядро, а еще туда надо кинуть данные, которые только что появились на плиске, и, не забыть обработать... Да, 40ГФлопс на ГПУ - в общем копейки и реально на раз делается, но не в реальном времени, а с конской задержкой и трафиком в 640МБайт/с.

Я не знаю как у вас устроен алгоритм и как все происходит в смысле обработки, но риалтайм на GPU это совсем не фатнтастика :biggrin: Кроме того, задвигая все в область с плис со встроенным камнем задача конечно решится, но цена одной плис будет такой что мало не покажется. Я уже молчу про все изделие.

 

Наиболее дешевое и простое решение- на том же джетсоне или платах типа этой или этой.

 

На всякий случай- только не подумайте что я предлагаю сделать свою плату на девайсах озвученных раннее, вовсе нет. Даже нет смысла пытаться :laughing:

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

Наиболее дешевое и простое решение- на том же джетсоне или платах типа этой или этой.

классно, спасибо за ссылки, я очень большой сторонник пользовать готовое, если есть на то возможность!

но цена одной плис будет такой что мало не покажется

у меня все в 5-й циклон впихнулось, с бюджетом 150 бакс за ИнетлЕдисон c Циклоном. А, да, зная хорошо алгоритм я могу позволить иметь одну общую экспоненту на довольно большой массив из чисел, с тем, что большая часть вычислений после этого идет без приведения к нормальному виду, экономя огромное число ресурсов плиски, но на ГПУшках смысла в этом большого нет, поэтому сравниваюсь флопами GPU/CPU.

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

про USB vs Ethernet - я считаю, что максимальная длина USB-кабеля длиной 5 метров отпугнёт немалое количество потенциальных покупателей.

 

про "lapack'n'blas-числодробилку внутри" - а собственно, зачем она вам внутри? почему не сделать второй блок?

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

про USB vs Ethernet - я считаю, что максимальная длина USB-кабеля длиной 5 метров отпугнёт немалое количество потенциальных покупателей.

наверное. Аргумент разумен, конечно удлинители (активные) никто не отменял, но уже с начала вчерашних обсуждений я об этом задумался.

 

про "lapack'n'blas-числодробилку внутри" - а собственно, зачем она вам внутри? почему не сделать второй блок?

я писал в этой теме, и не один раз. Без этого - примерно 20 раз медленнее идет эксперимент и надо 640МБайт/с трафика на рядом стоящий ПС.

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

у меня все в 5-й циклон впихнулось, с бюджетом 150 бакс за ИнетлЕдисон c Циклоном.

В том то и дело, если у Вас все влезло в плис то какой смысл еще разбрасыватьcя и усложнять девайс устанавливая мусор вроде эдисона? Проще наверное сразу плис со всеми необходимыми интерфейсами -и все :laughing: .

А, да, зная хорошо алгоритм я могу позволить иметь одну общую экспоненту на довольно большой массив из чисел, с тем, что большая часть вычислений после этого идет без приведения к нормальному виду, экономя огромное число ресурсов плиски, но на ГПУшках смысла в этом большого нет, поэтому сравниваюсь флопами GPU/CPU.

Если Ваш алгоритм лег на плис, то нет смысла ни в гпу ни в х86 :biggrin: Посмотрите борды от avnet.

 

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

В том то и дело, если у Вас все влезло в плис то какой смысл еще разбрасыватьcя и усложнять девайс устанавливая мусор вроде эдисона?

вижу, что у многих есть непонимание, и попытаюсь ясно и просто издалека ввести в курс дела.

 

Современные алгоритмы вычислительной математики (CFD, Maxwell, Tensor Approximations, Low Rank Approximations) обычно состоят из двух частей,

 

первая часть требует много вычислений (N) и хорошо параллелится (блочные матричные вычисления),

вторая часть требует мало вычислений (M) содержит сложные ветвящиеся алгоритмы (например диагонализация двухдиагональной матрицы для сингулярного разложения).

 

N>>M.

 

Теперь вспомним закон Амдаля, пусть P число процессоров, и первая часть практически полностью распараллелилась, тогда нам надо ждать N/P + M тиков, так как вторая часть ничерта не параллелится (диагонализация не совсем хороший пример, так как чуток параллелится, но с очень плохой эффективностью.

 

Из-за этого за последние 10 лет возникла концепция CPU + GPU, где хорошо параллелящаяся часть алгоритмов попадает на GPU, а ветвящаяся особо не параллелится и гоняется на CPU. Это - современное состояние дел в суперкомпьютинге, если не говорить об алгоритмах искусственного интеллекта, но там своя петрушка, которая к этому топику не относится.

 

Спросите Nvidia, есть ли у них реализация всего LAPACK ТОЛЬКО на графических картах, без использования центрального процессора? А вот BLAS есть еще с 2008 года.

 

Теперь представьте, что у меня есть 100мкс, за которые мне надо сделать 4М операций, которые хорошо параллелятся, и 3к операций, которые в основном состоят из условных операторов, и еще гуляют по большой таблице с пол гигабайта. Первая часть идеально ляжет на плиску, а вот вторая даже в DE0-SOC в HPSной части не может выполнить 3к таких операций за 100мкс. А вот Интел Эдисон - может, поэтому я и гоняю связку плиска с эдисоном, но в современной ситуации, когда еще не отгрузил никому аппаратуру наверное мог бы быстро перестроиться на что-то другое, если конечно это что-то на рынке имеется, иначе, когда я перейду с Эдисона на что-то другое, мне придется поддерживать все апдейты на обе платформы, что крайне не хотелось бы.

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

вижу, что у многих есть непонимание

У многих есть понимание того факта что задачи которые Вы описываете на эдисонах не решают и не пытаются(он для этого не предназначен а теперь еще и официально умер), поэтому и предлагают пусть местам компромиссные(возможно) но более-менее реалистичные варианты :laughing: Учитывая то что Вам хватило названного циклона и урезанного х86 проца с частотой 500МГц создается стойкое впечатление что Вы перебарщиваете.

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

Присоединяйтесь к обсуждению

Вы можете написать сейчас и зарегистрироваться позже. Если у вас есть аккаунт, авторизуйтесь, чтобы опубликовать от имени своего аккаунта.

Гость
К сожалению, ваш контент содержит запрещённые слова. Пожалуйста, отредактируйте контент, чтобы удалить выделенные ниже слова.
Ответить в этой теме...

×   Вставлено с форматированием.   Вставить как обычный текст

  Разрешено использовать не более 75 эмодзи.

×   Ваша ссылка была автоматически встроена.   Отображать как обычную ссылку

×   Ваш предыдущий контент был восстановлен.   Очистить редактор

×   Вы не можете вставлять изображения напрямую. Загружайте или вставляйте изображения по ссылке.

×
×
  • Создать...