iiv 29 21 июня, 2017 Опубликовано 21 июня, 2017 · Жалоба В самом деле, не понятно, чем таким незаменим этот процессор, кроме потребления. только тем, что можно 500-800МФлоп/с на двойной точности и стандартном x86 получать ну и памятью в 1ГБ. Так бы не думал и взял бы любой контроллер, но три миллиона строк кода туда не лезут, а часто и не компилятся на архитектурах отличных от стандартных x86 или жирных армов (на A15 еле-еле собрал, на pcduino A13 не смог). Цитата Поделиться сообщением Ссылка на сообщение Поделиться на другие сайты Поделиться
EvilWrecker 0 21 июня, 2017 Опубликовано 21 июня, 2017 · Жалоба Вы бы оставили при себе свои домыслы. И не ссылались на гугл, как на авторитет в данной области wink.gif Понятно Больше к вам вопросов не имею- ваше повсеместное и тотальное незнание вопроса очевидно, смысла разводить дискуссию и загаживать тему не вижу. По теме- кроме усб 3 я бы еще посмотрел на тандерболт. Цитата Поделиться сообщением Ссылка на сообщение Поделиться на другие сайты Поделиться
@Ark 3 21 июня, 2017 Опубликовано 21 июня, 2017 · Жалоба Понятно Больше к вам вопросов не имею- ваше повсеместное и тотальное незнание вопроса очевидно... Я в ваших оценках собственных знаний не нуждаюсь. Прекратите загаживать тему. Цитата Поделиться сообщением Ссылка на сообщение Поделиться на другие сайты Поделиться
EvilWrecker 0 21 июня, 2017 Опубликовано 21 июня, 2017 · Жалоба Я в ваших оценках собственных знаний не нуждаюсь. Да было бы что оценивать :laughing: только тем, что можно 500-800МФлоп/с на двойной точности и стандартном x86 получать ну и памятью в 1ГБ. Так бы не думал и взял бы любой контроллер, но три миллиона строк кода туда не лезут, а часто и не компилятся на архитектурах отличных от стандартных x86 или жирных армов (на A15 еле-еле собрал, на pcduino A13 не смог). Совсем забыл- пеньки и целероны тоже подходят, в смысле новые(той же генерации что и Atom E3900). Можете купить одноплатник соответствующий. Цитата Поделиться сообщением Ссылка на сообщение Поделиться на другие сайты Поделиться
iiv 29 22 июня, 2017 Опубликовано 22 июня, 2017 · Жалоба Совсем забыл- пеньки и целероны тоже подходят, в смысле новые(той же генерации что и Atom E3900). Можете купить одноплатник соответствующий. и в тех же габаритах и с более-менее рабочим SPI или еще каким синхронным интерфесом до плиски? Если да, дайте, пожалуйста ссылку. Цитата Поделиться сообщением Ссылка на сообщение Поделиться на другие сайты Поделиться
EvilWrecker 0 22 июня, 2017 Опубликовано 22 июня, 2017 · Жалоба и в тех же габаритах и с более-менее рабочим SPI или еще каким синхронным интерфесом до плиски? Если да, дайте, пожалуйста ссылку. Так а зачем плис еще? Если есть обработка которая плохо ложится на х86, поставьте GPU- если это чересчур то возьмите какой-нибудь модуль на новых ZYNQ (EG). Опять же, есть Jetson TX2. Цитата Поделиться сообщением Ссылка на сообщение Поделиться на другие сайты Поделиться
@Ark 3 22 июня, 2017 Опубликовано 22 июня, 2017 · Жалоба ... Пивовары и виноделы меня сразу пошлют подальше! Пивовары и виноделы вас и так пошлют подальше. Им нужен достоверный количественный анализ - концентрация конкретного вещества в продукте. У вас пока нет даже достоверного качественного анализа - на уровне есть/нет. Это не мои оценки, а специалистов - ваших коллег, которых я попросил познакомиться с вашей разработкой. Все это пока на уровне лабораторных экспериментов. До коммерческого использования - как до Луны пешком. Цитата Поделиться сообщением Ссылка на сообщение Поделиться на другие сайты Поделиться
iiv 29 22 июня, 2017 Опубликовано 22 июня, 2017 · Жалоба Так а зачем плис еще? Если есть обработка которая плохо ложится на х86, поставьте GPU- если это чересчур то возьмите какой-нибудь модуль на новых ZYNQ (EG). Опять же, есть Jetson TX2. цикл обработки данных от прихода до принятия решения - 100микросекунд, за которые на плиске делается примерно 4 миллиона вычислений и на х86 еще около 3к. ГПУшка обычно за это время успеет (если повезет) загрузить свое ядро, а еще туда надо кинуть данные, которые только что появились на плиске, и, не забыть обработать... Да, 40ГФлопс на ГПУ - в общем копейки и реально на раз делается, но не в реальном времени, а с конской задержкой и трафиком в 640МБайт/с. Да и Jetson TX2 не сильно по архитектуре от других ГПУ отличается, как я говорил, суть в том, что есть две части алгоритма, одна хорошо параллелится и требует все данные с сенсора и кучу флопов, а другая практически скалярна и не параллелится, и требует мало флопов, но все должно успеть за 100мкс, иначе снимать данных придется раз так в 20 больше, то есть в 20 раз дольше проводить измерения. Для многих задач - это становится неприемлемо. Это не мои оценки, а специалистов - ваших коллег, которых я попросил познакомиться с вашей разработкой. Смотрите, если кто и пытался ознакомиться, то писал мне, я посылал ему какие спектры получаю. Обычно люди после этого говорили не в таком тоне, как вы. И опять же интересно, откуда вы взяли, что есть только качественный анализ, додумались, статьи мои почитали, тогда покажите где там это написано? Просто интересно! А ваши специалисты-то хоть раз в глаза ЯМР спектрометр видели и на нем работали? Пивовары и виноделы вас и так пошлют подальше. А вот вы конкретно с ними лично на эту тему разговаривали? Я - да, и высказанное мне лично мнение пивоваров И виноделов той страны, где я живу, отличается от того, что вы сказали, наверное на это у них тоже есть какие-то причины, не так ли? Цитата Поделиться сообщением Ссылка на сообщение Поделиться на другие сайты Поделиться
EvilWrecker 0 22 июня, 2017 Опубликовано 22 июня, 2017 · Жалоба цикл обработки данных от прихода до принятия решения - 100микросекунд, за которые на плиске делается примерно 4 миллиона вычислений и на х86 еще около 3к. ГПУшка обычно за это время успеет (если повезет) загрузить свое ядро, а еще туда надо кинуть данные, которые только что появились на плиске, и, не забыть обработать... Да, 40ГФлопс на ГПУ - в общем копейки и реально на раз делается, но не в реальном времени, а с конской задержкой и трафиком в 640МБайт/с. Я не знаю как у вас устроен алгоритм и как все происходит в смысле обработки, но риалтайм на GPU это совсем не фатнтастика Кроме того, задвигая все в область с плис со встроенным камнем задача конечно решится, но цена одной плис будет такой что мало не покажется. Я уже молчу про все изделие. Наиболее дешевое и простое решение- на том же джетсоне или платах типа этой или этой. На всякий случай- только не подумайте что я предлагаю сделать свою плату на девайсах озвученных раннее, вовсе нет. Даже нет смысла пытаться :laughing: Цитата Поделиться сообщением Ссылка на сообщение Поделиться на другие сайты Поделиться
iiv 29 22 июня, 2017 Опубликовано 22 июня, 2017 · Жалоба Наиболее дешевое и простое решение- на том же джетсоне или платах типа этой или этой. классно, спасибо за ссылки, я очень большой сторонник пользовать готовое, если есть на то возможность! но цена одной плис будет такой что мало не покажется у меня все в 5-й циклон впихнулось, с бюджетом 150 бакс за ИнетлЕдисон c Циклоном. А, да, зная хорошо алгоритм я могу позволить иметь одну общую экспоненту на довольно большой массив из чисел, с тем, что большая часть вычислений после этого идет без приведения к нормальному виду, экономя огромное число ресурсов плиски, но на ГПУшках смысла в этом большого нет, поэтому сравниваюсь флопами GPU/CPU. Цитата Поделиться сообщением Ссылка на сообщение Поделиться на другие сайты Поделиться
krux 8 22 июня, 2017 Опубликовано 22 июня, 2017 · Жалоба про USB vs Ethernet - я считаю, что максимальная длина USB-кабеля длиной 5 метров отпугнёт немалое количество потенциальных покупателей. про "lapack'n'blas-числодробилку внутри" - а собственно, зачем она вам внутри? почему не сделать второй блок? Цитата Поделиться сообщением Ссылка на сообщение Поделиться на другие сайты Поделиться
iiv 29 22 июня, 2017 Опубликовано 22 июня, 2017 · Жалоба про USB vs Ethernet - я считаю, что максимальная длина USB-кабеля длиной 5 метров отпугнёт немалое количество потенциальных покупателей. наверное. Аргумент разумен, конечно удлинители (активные) никто не отменял, но уже с начала вчерашних обсуждений я об этом задумался. про "lapack'n'blas-числодробилку внутри" - а собственно, зачем она вам внутри? почему не сделать второй блок? я писал в этой теме, и не один раз. Без этого - примерно 20 раз медленнее идет эксперимент и надо 640МБайт/с трафика на рядом стоящий ПС. Цитата Поделиться сообщением Ссылка на сообщение Поделиться на другие сайты Поделиться
EvilWrecker 0 22 июня, 2017 Опубликовано 22 июня, 2017 · Жалоба у меня все в 5-й циклон впихнулось, с бюджетом 150 бакс за ИнетлЕдисон c Циклоном. В том то и дело, если у Вас все влезло в плис то какой смысл еще разбрасыватьcя и усложнять девайс устанавливая мусор вроде эдисона? Проще наверное сразу плис со всеми необходимыми интерфейсами -и все :laughing: . А, да, зная хорошо алгоритм я могу позволить иметь одну общую экспоненту на довольно большой массив из чисел, с тем, что большая часть вычислений после этого идет без приведения к нормальному виду, экономя огромное число ресурсов плиски, но на ГПУшках смысла в этом большого нет, поэтому сравниваюсь флопами GPU/CPU. Если Ваш алгоритм лег на плис, то нет смысла ни в гпу ни в х86 Посмотрите борды от avnet. Цитата Поделиться сообщением Ссылка на сообщение Поделиться на другие сайты Поделиться
iiv 29 22 июня, 2017 Опубликовано 22 июня, 2017 · Жалоба В том то и дело, если у Вас все влезло в плис то какой смысл еще разбрасыватьcя и усложнять девайс устанавливая мусор вроде эдисона? вижу, что у многих есть непонимание, и попытаюсь ясно и просто издалека ввести в курс дела. Современные алгоритмы вычислительной математики (CFD, Maxwell, Tensor Approximations, Low Rank Approximations) обычно состоят из двух частей, первая часть требует много вычислений (N) и хорошо параллелится (блочные матричные вычисления), вторая часть требует мало вычислений (M) содержит сложные ветвящиеся алгоритмы (например диагонализация двухдиагональной матрицы для сингулярного разложения). N>>M. Теперь вспомним закон Амдаля, пусть P число процессоров, и первая часть практически полностью распараллелилась, тогда нам надо ждать N/P + M тиков, так как вторая часть ничерта не параллелится (диагонализация не совсем хороший пример, так как чуток параллелится, но с очень плохой эффективностью. Из-за этого за последние 10 лет возникла концепция CPU + GPU, где хорошо параллелящаяся часть алгоритмов попадает на GPU, а ветвящаяся особо не параллелится и гоняется на CPU. Это - современное состояние дел в суперкомпьютинге, если не говорить об алгоритмах искусственного интеллекта, но там своя петрушка, которая к этому топику не относится. Спросите Nvidia, есть ли у них реализация всего LAPACK ТОЛЬКО на графических картах, без использования центрального процессора? А вот BLAS есть еще с 2008 года. Теперь представьте, что у меня есть 100мкс, за которые мне надо сделать 4М операций, которые хорошо параллелятся, и 3к операций, которые в основном состоят из условных операторов, и еще гуляют по большой таблице с пол гигабайта. Первая часть идеально ляжет на плиску, а вот вторая даже в DE0-SOC в HPSной части не может выполнить 3к таких операций за 100мкс. А вот Интел Эдисон - может, поэтому я и гоняю связку плиска с эдисоном, но в современной ситуации, когда еще не отгрузил никому аппаратуру наверное мог бы быстро перестроиться на что-то другое, если конечно это что-то на рынке имеется, иначе, когда я перейду с Эдисона на что-то другое, мне придется поддерживать все апдейты на обе платформы, что крайне не хотелось бы. Цитата Поделиться сообщением Ссылка на сообщение Поделиться на другие сайты Поделиться
EvilWrecker 0 22 июня, 2017 Опубликовано 22 июня, 2017 · Жалоба вижу, что у многих есть непонимание У многих есть понимание того факта что задачи которые Вы описываете на эдисонах не решают и не пытаются(он для этого не предназначен а теперь еще и официально умер), поэтому и предлагают пусть местам компромиссные(возможно) но более-менее реалистичные варианты :laughing: Учитывая то что Вам хватило названного циклона и урезанного х86 проца с частотой 500МГц создается стойкое впечатление что Вы перебарщиваете. Цитата Поделиться сообщением Ссылка на сообщение Поделиться на другие сайты Поделиться