Jump to content

    

iiv

Свой
  • Content Count

    2271
  • Joined

  • Last visited

Everything posted by iiv


  1. нет, почему-же, то в Уфе, то в Салавате, то в Магнитке, то в Белорецке, то в Озерске бываю, поэтому и деревня - одна из этих. покорнейше прошу Вас простить мою литературную неподготовленность - у меня даже в школе по чтению и литературе всегда четыре было, поэтому у Ломоносова я только закон сохранения знаю. Больше к Михаилу Васильевичу я как-то почти и не относился, разве что универ, его именем названый, в свое время окончил. Ну а если что-то о себе не написал, значит не считаю нужным об этом упоминать при этом обсуждении.
  2. Согласен, что в Мап Вьювере поинтереснее :) и очень благодарен Вам за возможность поучиться! Мысли такие, рассмотрим вначале 400->200MHz. Для этого случая я вижу только две альтернативы, одна, как я написал always @(posedge Clk400) begin TempIn400<=In400; if(Clk200) Out200<={TempIn400, In400}; end и вот такая always @(posedge Clk400) TempIn400<=In400; always @(posedge Clk200) Out200<={TempIn400, In400}; Последний вариант меня смущает тем, что при выполнении присваивания в Out200 исходные аргументы могут измениться. В то же время, этот вариант компилится без слаков. Что я здесь не так понимаю? Теперь случай, когда на входе 200, а на выходе 400МГц. Понятно, что можно написать что-то типа assign TempOut400=In200[Clk200]; always @(posedge Clk400) Out400<=TempOut400; но я не могу логически почуствовать разницы между тем, что я написал старте топика и этим ассигном. Буду очень благодарен тому, кто тыкнет меня носом в мои заблуждения. ЗЫ Денис, опять ты мне Выкаешь, мне стыдно, а ты Вы да Вы.
  3. Да, видел я что в RTL получается, и понятно, что не должно оно на больших скоростях работать :( Только вот у меня как-раз в том-то и вопрос, как такие конструкции ПРАВИЛЬНО реализуются? Вдруг кто сжалится и посоветует, буду очень благодарен! Уже весь вечер голову ломаю.
  4. Всем привет, запутался, не понимаю как правильно реализовать передачу данных с одного клока на другой. Пусть у меня есть два клока, wire Clk400, Clk200; my_pll my_pll_module(Clk50, Clk400, Clk200); которые я получаю с одного PLL и эти клоки имеют частоты 400 и 200МГц соответственно. Мне часто надо переводить два данных с клока 200 в одно данное в клоке 400 и наоборот. Можно конечно это делать и с помощью ФИФО, но вроде тут нечего конвейеризовать, поэтому хочется сделать например так: reg In400; reg Out200[0:1]; reg In200[0:1]; reg Out400; reg TempOut400, TempIn400; always @(posedge Clk400) begin // переводим из 400 в 200 TempIn400<=In400; if(Clk200) Out200<={TempIn400, In400}; // переводим из 200 в 400 if(Clk200) {Out400, TempOut400}<=In200; else Out400<=TempOut400; end но у меня всегда при компиляции проекта возникают слаки от Clk200 к Out200 и Out400. Посоветуйте, пожалуйста, кто знает, как с этим можно побороться! Спасибо ИИВ
  5. Улыбнуло! Уважаемый Метан, я уже уговорился беседовать с Вами по этому и остальным, Вас волнующим, вопросам в курилке, поэтому продолжу флудить в этом топике только после того, как модераторы переместят его в курилку!
  6. я, к сожалению, не на столько многостаночник :) думаю, что в России, да и во всех остальных странах бывшего Советского Союза, кризис в строительстве на порядки меньше, кризиса в электронике. Сугубо ИМХО. Переубедите, пожалуйста, фактами, если я не прав! Не, в 40 лет я буду директором, или замом, большой, научной, транснациональной компании, которая будет выпускать кучу всего умного и в электронике, и в софтвере, и в научных разработках. А за оставшиеся до моего сороколетия три года мне надо многому научиться :) PS: Уважаемые Модераторы, а можно Вас любезно попросить двинуть этот топик в курилку? А то как-то получается и профиль у меня не совсем по электронике, да и обсуждения ведутся тоже совсем не об этом. Спасибо!
  7. Я с Вами отчасти согласен - потому, что действительно сразу много денег будет, но частично не согласен, потому, что, например, у меня сейчас идет очень интересный проект по плиске, (des00 думаю, может подтвердить) и, в этом случае, проект надо будет закрыть. Мечта (думаю почти неосуществимая) интересные проекты и хорошие деньги. А стройку я больше для проветривания мозгов, а не для заработка рассматриваю - реально помогает.
  8. Вы правы, только с моей комплекцией - балетом как-то криво наверное будет. Пойду лучше на стройку..., может плитку класть, может кирпичи (в выходные кстати на стройке работал). Иногда помогает, особенно когда долго мозгами работаешь. где 35, там и 37 :)
  9. Благодарю Вас, Александр, а также всех на форуме за теплые слова! Кфмн диссер я защитил в 1999 году, на постдока не возьмут. Ну и какой нормальный проф возьмет постдоком человека, с несколькими джаксами, и еще кучей других, более и менее путевых статей, я бы на его месте не взял был, такой аппликант слишком умен и это не удобно в научном мире :( Вот поэтому я хотел бы, по возможности, задвинуть свой научный опыт временно в сторонку, и таки помахать лопатой - то есть разобраться с плисками, контроллерами, и тд., а чтобы работодатель мой опыт расматривал бы только с точки зрения того, что если я что-то захочу, то я этого добьюсь.
  10. Очень благодарен Всем Вам за ответы, скажите, пожалуйста, я правильно понимаю, что вот это: http://www.watterott.com/index.php?page=pr...t&info=1700 уже с антенной, и, как раз МТК? Стоит это брать, скажите, пожалуйста (тут цена нравится)? Или лучше NEO-6M-0 от u-blox, http://shop-emea.u-blox.com/abashop?s=274&...ail&sku=556 или его не достаточно (нет активной антенны) и надо http://shop-emea.u-blox.com/abashop?s=274&...ail&sku=739 (тут уже немного дороговато, но если прием действительно лучше будет, то лучше его возьму) Сирф-4 готовый с большой антенной не нашел, хоть и гуглил сколько смог. Только чип - есть. А он действительно лучше ублоксов и мтк? Помогите, пожалуйста, разобраться, полностью на Ваши советы положусь! Спасибо! PS: Друг может и то и другое привезти прямо оттуда, если у них на складе втечение месяца появится. PPS: реально не хочется больше экспериментировать, а взять пусть дороже, но чтоб гарантированно. В Рюкзаке положить его сверху с медным экраном - думаю не проблема, а вот доставить что-то путевое сюда из Европы или Китая - не быстро все как-то бывает :( ИИВ
  11. Поштучно Техас на раз Вам хоть в Иран продаст, (с Ираном не проверял, но поштучно проверял). А вот если сотню запросите (а для этих и даже больше 5), могут и запросить лицензию.
  12. Всем привет, собственно сабж. Желательно не тяжелый (до пол кг). Хочу сделать самопальный логгер позиции для моих туристических походов (люблю шарахаться по горам у нас на Южном Урале). Причины, почему не хочу пользовать готовое: 1. несколько раз пробовал, в лесу почти не ловит, пробовал Sirf 3, 3lp от поляриса с небольшой внешней антенной (кажется 20дБ усиления) и без, очень хорошо ловит в поле и в горах без леса, но в густом лесу не видет вообще ничего 2. хочу одновременно с GPS мониторить ускорение, компас и гироскопы и проверить или опровергнуть пару своих математических изысканий в области позиционирования и обработки данных. Втыкать хочу в DE0 (Terasic) борду с плисиной (на работе валяется без дела, могу попользовать) в которую я введу датчики от магнетометров и гироскопов. То есть со всем, кроме GPS у меня ястность имеется, а вот какой GPS использовать (какой чип) какую внешнюю антенну чтоб уверенно в густом лесу и в гористой местности ловило - не знаю. Знающие люди, подсскажите, пожалуйста! Как соберу и опробую, выложу отчет о результатах. ЗЫ: не хотелось бы рассматривать GPS дороже 3т рублей, иначе жаба задушит, я чисто в свое удовольствие это хочу делать, да детям показать, как мы с ними по горам шарахались. ЗЗЫ: если я не в тот топик запостил, извиняйте, не разобрался, посоветуйте или перенесите куда надо, пожалуйста! Спасибо ИИВ
  13. Покупать эту статью лениво, но я могу привести противоположное мнение Читаем этот документ, тесты на С1060, получено 3ГФлопа. Достал из чулана старую теслу С1060, чтоб по-чесному было, запустил только что на ней GEMV (то, что эти авторы почему-то называют GAXPY), получил 31ГФлопс. После такого вранья читать дальше этот опус расхотелось. здесь я не в теме, случайными числами не занимаюсь, поэтому ни критиковать, ни одобрять не буду, подсознательно сомневаюсь в том же направлении. ЗЫ: современный 5790 радеон у меня делает ту старую С1060 Теслу раз так в 10. А на плисках за два последних года число умножителей в 10 раз тоже увеличилось? :) согласен! Тоже согласен, если задача позволяет. Одна задача мне позволила сделать такой ход конем на третьем стратиксе, и чтобы получить такую же скорость обработки данных, я должен был достичь 900ГФлопс на ГПУ. К сожалению, это не всегда проходит, так же как не всегда проходит с памятью, конвейерами и другими способами оптимизации на ГПУ. ИМХО, время разработки на плиске в разы а то и десятки раз больше, да и сложную ветвящуюся задачу не положить, в которой два разных алгоритма примерно одинаково ресурсы должны потреблять, а работать - последовательно. на ГПУ решается просто последовательной загрузкой разных кернелов. Согласен. Мои данные о той же 900ГФлопной задаче - плисовская борда потребляла 20ватт, а система с двумя ГПУшками на шестиядернике - около 700 ватт. Хотя гигафлопы на бакс оказались одинаковыми :(
  14. Если развертки нет, то, так конечно не решить, но я как-то не уловил, что у топикстартера именно такая постановка. Если да, то Вы правы. То как мы решали, там развертка по времени была.
  15. Топикстартер в 13-ом сообщении писал "МП в 3-х точках" то есть у него не совсем все одномерно :) Для каждого измерения по ЛП вытаскиваете задержки до каждой из труб, а по трем точкам и сопоставлениям этих задержек, Вы все эти трубы увидете. Что-то не так? У нас именно так эта задача и решалась, поэтому я очень интересуюсь с топикстартером обменяться опытом по его частотам, вдруг у нас что-то можно улучшить.
  16. Повидимому, Вы вначале не поняли меня, а я, был на столько удивлен Вашим комментарием, что не стал разбираться из-за чего Вы так возмутились. МП по времени - функция, которую и стоит поместить в эту матрицу, как ее дискретизовать и оцифровывать - зависит от габаритов труб, и частоты несущего сигнала. В дискретном виде - МП просто набор из довольно большого числа измерений.
  17. в этом случае, как я и написал, считайте SVD и будет Вам счастье
  18. нет, не всегда, или все еще решают! Там иногда бывают трубы, которых нет в плане и их-то как раз хочется найти!
  19. я, к сожалению, не в теме, но, смею предположить, что для того, чтобы просуммировать 16к однобитовых чисел, Вам нужно как-то эти данные в плиску завести. Сколько тактов будет это длится? Поэтому, совершенно согласившись с Вами, что это нужная народному хозяйству задача, сомневаюсь, что в Вами предложенном примере, эта операция выполняется каждый такт, а, если это не так, то, повидимому эту операцию можно из 16к параллельных шагов перевезти в что-то совсем не параллельное. Поправьте меня, пожалуйста, если я не прав! ИМХО, 2 Alexium: основное достоинство плиски перед процессором - быстрый ввод данных. и еще достоинство - битовые и логические операции. Я бы на Вашем месте попробовал показать все на примере совсем примитивного роутера етернет или еще каких пакетов, соединяющее несколько компьютеров. ИМХО безпроигрышный вариант для Вас, так как можно вместо етернет придумать что-то ну совсем простое (Вы же диплом пишете, или как) ну и на процессоре все тоже просто, а показать, что даже самая самая простая девборда (ДЕ0, например) может на раз прокачать 2-3ГБайта в секунду, а от процессора Вы это еще долго просить будете, тут будет совсем просто. Конечно может прокатить и пример с тяжелыми вычислениями, но только при условии, что профы на защите не в курсе про многопоточность, многоядерность и тд, но тут и самому может быть не сильно приятно утверждать то, что не есть правда на самом деле...
  20. Позвольте с Вами не согласиться по поводу утверждения "процессор это будет делать последовательно". Действительно, лет 20 назад десктоповые процессоры были последовательными и языки для них придумывали с последовательной логикой, но сейчас это совсем уже прошлый век, а то и прошлое тысячелетие. Вот сижу я сейчас за обычным и7, вставлен он в режиме мультитреда, и при порграммировании мне приходится писать специальные ОпенМП команды почти перед каждым циклом, чтобы тело цикла было разбросанно по тредам, которых в моем компьютере 8 штук получается. Если в теле цикла у меня есть последовательность арифметических операций, которая не зависит последовательно друг от друга по аргументам, то компиллер (обычный GNU Fortran) разбрасывает это все по SSE2-SSE3 так, что я могу выполнить до 4 операций с двойной точностью за такт, или 8 операций с одинарной точностью за такт В КАЖДОМ треде. Итого, 64 параллельных операций я всегда должен иметь ввиду даже на моем дохлом компе, стоимость которого меньше штуки зеленых, а ведь бывают и по 24 ядра машинки! И это все даже не графические карты, а обычные процессоры, конечно если Вы будите сравнивать плиску с Пиком или Атмегой, то да, там все последовательно, но, не с современными Интелами и АМДшниками, там уже 20 лет как все параллельно, только пользоваться этим правильно надо, как и в плисках!
  21. А это уже интереснее, действительно, суммы, разности, логика, особенно битовых операций, на плисках можно сделать эффективнее, из-за того, что в плиске таких устройств много - вот в 4 циклоне 114к операций можно забабахать, при стоимости борды в 500 бакс, а это при частоте в 200мгц будет 2*10^{13} операций в секунду. Если такие операции не удалось распараллелить внутрь 32 битного инта, то самая быстрая карта от АТИ сможет сделать только 5*10^{12}, что, конечно, в 4 раза меньше. А вот придумать реальную задачу, нужную "народному хозяйству", будет довольно не легко. А в ГПУ кстати необходимо имень около 1000-10000 параллельных комманд, чтобы загрузить все арифметические устройства, и, 16к сумма конечно есть довольно плохой пример для ГПУ, так как бинарное дерево параллелится только по логарифму от пика производительности, и умножители не будут задействованы, поэтому эффективность такой операции по сравнению с пиком производительности будет, думаю, около 0.1.
  22. Уважаемый jojo, не первый раз вижу, что Вы утверждаете, что ПЛИС лучше или быстрее GPU. Простите меня покорнейше, не ради стеба, а реально сильно интересуюсь на какой же все-таки задаче (не притянутой за уши) такое происходит? ИМХО. Я сам знаю одну такую задачу, но только одну... Во всех остальных, при одинаковой цене, GPU делает плис как тузик грелку, обычно в 10 и более раз. Ессно я не рассматриваю графические карты лаптопов или очень дешевые GPU, но и вычислительные плиски (а борды тем более) редко меньше пары сотен зеленых стоят.
  23. На нвидишных графических картах от CUDA 1.3 и выше наш соотечественних Волков, сидящий у Деммеля смог пол аппаратного пика для FFT сделать. То есть если у Вас 4к чисел, то на дешевой карте полное преобразование можно посчитать за 0.4 мкс в двойной точности и примерно за 0.1 мкс в одинарной. Чтобы такое же получить на плиске, минимум пятый стратикс надо взять на 4к умножителей, и то не факт, что влезет. У АТИ-АМД еще круче, недавно видел инфу, что FFT для 1к на одном ядре модернового Радеона можно получить за 20нс, а на карте два ядра, то есть два FFT по 1к за 20нс - боюсь, что ни одна плиска не потянет. А если по-честному, распараллелить по всем ядрам проца, попользовать SSE2-SSE3 то проц очевидно в 4-16 раз быстрее будет все это выплевывать, а если все сидит в кеше, то есть если взять 3-ий стратикс, который результат будет плевать с частотой 400МГц, и квад-кор с 3ГГц, то последний с легкостью сделает по 4 FIRа с частотой 250МГц, ессно что стратикс будет серьезно не дешевле квад кора... Короче я к тому, что задачу подобрать, чтобы плиска была лучше - не совсем-то и просто, особенно если с процессора (а тем более с ГПУ) снимать то, что реально снять можно. ИМХО: у процев и ГПУ очень логические операции хромают, так как АЛУ все на плавующую точку заточены, а у ПЛИСки как раз на оборот. посмотрите в эту сторону, криптография, и тд. Возможно что-то и найдется. У меня у самого есть только одна задача, где плиска больше флопов показывает, но только из-за того, что в плиску удается очень быстрый (2ГБайт в секунду) поток завести, а, то же самое с обычным процем потребовало бы больших габаритов.
  24. Терасик очень рекомендую - хорошее качество, официальный Альтеровский поставщик, сам пользую несколько борд от него - очень доволен. Одну борду пытался сжечь не правильным подключением переферии, не получилось и все до сих пор функционирует!
  25. У вас МП чем измеряется, направленно? Вы можете измерить его полностью векторно? Похожие задачи хорошо решаются методами малоранговых аппроксимаций - сохраняете сигнал в первый столбец, сдвигаете его, сохраняете во второй, и т.д. а у полученной матрицы ищите малоранговую аппроксимацию, метод схож с LP, но имеет больше возможности для игры с шумом. ОФФ, а Вы случаем, не из Екатеринбурга? Если да, мне Ваша задача известна, пишите в личку, обсудим