Jump to content

    

Hale

Свой
  • Content Count

    1037
  • Joined

  • Last visited

Community Reputation

0 Обычный

About Hale

  • Rank
    Профессионал

Контакты

  • ICQ
    Array

Recent Profile Visitors

6201 profile views
  1. Это метод лабораторного "на коленке" вполне себе приемлем для "взять и посмотреть". SMA вентили никуда не убегут, будут реюзаться еще 15 лет. Неприемлем для сдачи проекта.
  2. >процессора это не шибко интенсивная задача, а вот для контроллера памяти - максимальная из-за размеров матриц. На самом деле довольно интенсивная, т.к. в FEM решение находится из перевернутой матрицы. А переворот матрицы происходит путем многократного перемножения исходной матрицы, для чего и придуманы SIMD инструкции FPU. К сожалению с курса вышки я уже не помню как это делается, но суть в том что перемножать можно в любом порядке и матрицы-множители раскидывают по разным ядрам, что увеличивает производительность кратно количеству ядер. А поскольку, как я понимаю, исходная матрица может никуда не двигаться, то большой общий L3 кеш процессора (но не многопроцессорной системы) неплохо помогает ускорить весь процесс. Именно об этом много лет и говорит Ансис. До 2015 версии они везде тиражировали график на котором производительность почти кратно растет. Я лично получал почти такой же результат на i7(до 4 ядер) и DP Xeon-W (до 8+8 ядер) в 2013 году. Может только чуть более горбатый - я работаю с ферритами. Тогда DP Xeon имел оптимум на 8 ядрах, на 10 упирался. Ну и конечно, когда заполняются регистры под SIMD инструкции - пропускная памяти очень даже приходится кстати. Те. важны и скорость памяти и FPU. //"HPC Options For HFSS", 2010 Тиражировали они этот график с 2010 года до 1015, а потом стали "забывать", потому что Driven Modal солвер в какой-то момент сломался и больше 4 ядер масштабироваться перестал. наверное главный программист-математик помер, или уволился. Поэтому в материалах 2020 года они уже приводят не график испытаний, а некий теоретический график с линейным ростом для гипотетического метода "Matrix multi-processing" //"How to Optimize the Speed and Scalability of Ansys HFSS with Ansys HPC", 2020 >А про "веб и гейм серверы" - это, конечно, снова мимо, там многоядерные варианты с 28 ядрами прекрасно себя проявляют, это как раз тот случай, где флопсы и большой кэш важнее всего. В играх и серверах много условных переходов. Там не флопсы а MIPSы важны! Чувствуйте разницу. Флопсы там вообще на третьем месте.
  3. неумение формулировать и нежелание давать точные ссылки вместе с безумным желанием поспорить у некоторых соучастников приводит вот к таким вот результатам: Поясняю, картинка без ссылки ЯВНО и без вариантов говорит о насыщении (боттлнеке) ядер. Т.е. прямая линия от 0(!) до 8 ядер вообще не расходится и не влияет на пропускную. О чем это говорит? О том что память ни при чем и процессор вошел в насыщение порожним кодом. Дальнейшее распараллеливание входящих данных помогает и линии расходятся. Впрочем быстро упираясь в пропускную памяти. И вот в этом случае опять таки помогает увеличение количества каналов (потолок поднимается). Это какая-то безумная картинка не имеющая к симуляторам никакого отношения. Но типичная для всяких веб и гейм серверов занимающимся большим I/O с сетью и внутренним обдумыванием "чоделать". Ну а в сухом остатке старая формула остается без изменений - максимальная пропускная для переклвдывания памяти и максимальные клоки ядер при их небольшом количестве (от 2 до 8).
  4. планарные ферритовые вентили целесообразно ставить только на согласованный выход, т.к. планарные ферритовые вентили сами по себе Г, узкополосны, капризны к температурному режиму, да еще отражением вы промежуточные каскады убьете. а корпусированные широкополосные вентили великоваты и... ну блин у вас прибор на вес VVS брилльянтов от Картье потянет если на каждый каскад пихать. В идеале вентиль д.б. дополнительным устройством для перестраховки на работающей схеме.
  5. Но Вы тоже, странный какой-то, вам открытым текстом, черным по белому пишушь, что нет возможности применить пенопласт дома... а вы все пенопласт кидаете. > да еще и фильм посмотрите О да, черпать информацию из голливудских фильмов - это наше все. Чукча не читатель, чукча в гугль посылатель. Может чукча все-таки прочтет первый пост где четко сказано - для образовательных целей демонстрация подъемной силы,а не нисходящее планирование за счет сопротивления, чем пользуются складные модели самолетов. Но скорее всего чукча просо не в курсе подъемной силы.
  6. тем не менее желающих πоπ.. слетелось. а по сути вопроса ни одного значащего ответа.
  7. >У вас есть доказательства. то что много раз слышал по телевизору из научно-популярных передач и от соседа, бывшего техника на испытательном полигоне. ну и наблюдение за катастрофами. >Кстати, вот еще один случай, с_A330_над_Атлантикой. AI в этом самолете в те года вряд-ли присустcтвовал. The A330 shares its airframe with the early A340 variants. Both airliners have fly-by-wire. Последнее в современных самолетах предполагает некоторую систему AI стабилизации. Кстати, именно недоработка в подобном AI в свое время угрохала 737 MAX в Эфиопии. >u_samoleta_otkazal_dvigatel_vo_vremya_poleta_8353535 Это одномоторная Цессна, или что-то подобное из 60х. не придуривайтесь. для таких самолетов это штатная ситуация. иначе у нас бы не осталось молодых пилотов. Знаменитое "Судо на Гудзоне", не протсо так называют чудом. Обычно в этой ситуации самолет падает камнем. Но пилот: Sullenberger was appointed to the United States Air Force Academy, entering with the Class of 1973 in June 1969. He was selected along with around a dozen other freshmen for a cadet glider program, and by the end of that year, he was an instructor pilot. In the year of his graduation, 1973, he received the Outstanding Cadet in Airmanship award, as the class's "top flyer".
  8. >с устойчивостью и способностью пилота справится с самолетом большинство пилотов без помощи AI не смогут справиться с таким "полетом" не придумывайте.
  9. >Так он использует набранную скорость он использует скорость ветра. даже птица может подниматься вертикально с места. > надо только гнуть полный профиль, подбирая в процессе форму и толщину. легко сказать "подбирая". а вы подберите с первого раза. поэтому и ищу готовую выкройку с хорошими воздухоплавательными параметрами.
  10. >Планировать без работающих двигателей могут все самолеты AFAIK это немножко заблуждение - многие современные самолеты без тяги планируют не лучше кирпича. Особенно военные, особенно невидимки оснащенные управляемым вектором тяги. Другое дело что лайнер может тянуть даже на одном моторе чтобы не свалиться. AFAIK аэродинамическое качество тут ни при чем - оно не учитывает балансировку самолета; а самолеты рассчитывают под работающие двигатели. А.К. вообще ничего не говорит об устойчивости самолета, но однозначно подсказывает об экономической составляющей, о расходе топлива . Т.е. верно что экономичный самолет обладает высоким А.К., но одно только А.К. не гарантирует длительный полет без двигателей. Вопрос остается открытым. Есть у кого-нибудь выкройка бумажного самолетика с аэродинамическим качеством больше 50 который не клюнет носом для наглядной демонстрации эффекта от профиля крыла?
  11. тяга, да. если бы был мотор, то можно и неустойчивую конструкцию. тянуть против сопротивления. так некоторые лайнеры и летают. убери у них мотор, рухнут штопором. а некоторые, особенно старые типы, сполне способны планировать на заглохшем моторе. Интересно бы бумажный аналог настоящего планера сделать.
  12. HardEgor именно. Но планирование может происходить и с использованием подъемной силы. Спортивный планер примерно так и делает, поворачивается против ветра и быстро набирет высоту без всякого крена. Вот эименно это и хочу посмотреть, показать - устуойчивое планирование на сравнительно низкой скорости, когда обычный самолетик уже падает. >Если про подъемную силу, то лист надо изогнуть и дуть на него. Это не сработает. Обратная сторона должна иметь меньшую площадь. Это профиль типа "индийский огурец". Но тут еще важен баланс с силой сопротивления и общей развесовкой. У меня сходу не получилось. >Гугл говорит, что все есть. Купить готовое и только склеить или только чертежи. Есть ли у кого-нибдуь без "купить" и проверенное. гугл много что говорит. Но в большинстве случаев это либо не летает, либо оригами на 12000 сгибов. Модели реальных самолетов я и сам клеить умею. Нужно что-то предельно простое и хорошо планирующее. Знаете, такие в 70-80 были популярны детские модели на тонком пенопласте, или рисовой бумаге, и на раме из бальзы. Вот бальзы под рукой нет, а травить детей жженым пенопластом я не хочу. >Но подъемная сила считается по Жуковскому. Это детям трудно... Контурные интегралы... В основе теорема (формула, закон) Бернулли, которую трудно на пальцах объяснить. Да знаю я. Можно и в CFD запустить, благо мы контуры воздушного охлаждения считаем. Но пожалуйста без этого. Если есть готовая рабочая выкройка, я бы вечер на сборку потратил.
  13. даже не знаю где спросить про игрушки. раз речь о подъемной силе, пусть будет физика. Нет ли у кого-нибудь рабочих выкроек для простого планера из бумаги, чтобы продемонстрировать ребенку эффект подъемной силы? сделал из бумаги на глаз по памяти что-то с пропорциями немецких фронтовых планеров из фанеры. неустойчив, сразу шашлычит вокруг крыла. Т.к. из материалов дома только лист А4 и двусторонний скотч, профилирование из пенопласта отпадает. Клеить полые объемные модели я привык с детства, даже модели из книжек помню летали чуть лучше кирпича. Но хочется что-то для реальной демонстрации, и чтобы за пару часов собрать вместе.
  14. >FSB в процах не используется уже 12 лет Поэтому и ответ - нет там ботлнека. >Пропускная способность кэша никак не поможет читать из памяти быстрее - если в кэше нет то чего надо прочитать Именно поэтому ответ - память медленнее всего переисленного и процессор не может быть боттнеком, входящим в насыщение, если его не использовать почти эксклюзивно для порожней работы. >у интела каждое ядро может читать не быстрее 15-18 ГБ/сек откуда данные? насколько я знаю, кеш для того и придуман чтобы нивелировать задержку на выборку. Кроме того - переворот матриц производится простыми последовательными умножениями и перекладываниями(ну в зависимости от алгоритма, которых я с Вуза даже не открывал... но не суть) вполне последовательных данных. А насколько я себе представляю, современный кеш читает в память с небольшим упреждением как раз для исполнения последовательного кода и чтения последовательных данных. Кроме того DDR, да еще многоканальный читает огромными блоками, т.е. 64бит x2 x-число_каналов, возможно большими. Т.е. вы выбираете одно слово, а в кеш с вероятностью как минимум 50% попадает еще несколько последующих даже без упреждения. Только за счет многоканальности. А пропускная кеша - это 80L1/40L2/20L3 GB/s против 10GB/s пропускной памяти (D.Molka "Main Memory and Cache Performance of Intel Sandy Bridge and AMD Bulldozer") из того что я нашел на графиках тестирования. Цифры там для частного случая, но относительные масштабы примерно ясны. Берем ваши 18Gb и умножаем на x4 - это примерная пропускная L2. Если смотреть графики, вот где есть насыщение, это в памяти, всегда. При любом тестировании. А расхождение линейного участка от количества каналов, это уже специфика тестирования по моему мнению. У кого-то угол и потолок возрастает от количества каналов, у кого-то насыщается. про STREAM https://www.intel.ru/content/dam/doc/white-paper/resources-xeon-7500-measuring-memory-bandwidth-paper.pdf your STREAM bandwidth score would be ~25% below what the platform is actually transferring to/from memory. To ensure the STREAM result reflects the actual bandwidth capabilities of the platform, and the extra “read” transaction is not issued, most processors have a “non-cacheable” write transaction or something similar, which tells the processor to do the write without first doing a “read for ownership”. Но это фактически технологическое измерение к реальной жизни отношения не имеющее. И где ссылка на документы которые вы скриншотите? вы говорите о STREAM, но у вас даже нет подтверждения что они использовали именно его, а не тестировали свой серверный совт своими бенчмарками. >А вот FEM солвер крайне требователен к производительности памяти, так что тут ядра проца толкаясь локтями за доступ к памяти очень быстро выводят контроллер памяти в насыщение. - Замечательно, вы мне только что доказывали что в насыщение входят ядра процессора и до 18 ядер не способны использовать 6-канальный контроллер на полную, значит 2-канального достаточно. Так было дело? ... вот что я вужу - вы путаетесь в собственоручно построенной реальности. >Но не буду травмировать вашу Ради бога, не проецируйте на меня свои душевные расстройтсва. >Ну значит это был совет для CST, потому как CST в курсе NUMA и позволяет выбирать количество задействуемых процессоров, а не только расчётных потоков. А какая разница? Один поток- один процессор. Умеет ли HFSS решать на какое ядро ему закрепитьк акой поток? Нет. В windows10 ядро ОС решает какое ядро быстрее(да, она знает о "предпочтительных" ядрах Интеля) и меньше загружено. Плохо что HFSS не может исключить из этого процесса HT копии... но по моему новый планировщик Windows лучше справляется с опознаванием нагрузки на ядрах чем win7. Дело же не в ядрах, а в данных, чтобы точно знать какой нод NUMA привязан к какому ядру и знать куда ты пишешь. Если честно, я даже AWE не освоил, и полагаю что это чертовски муторная задача, вдобавок исключающая кроссплатформенность. Я не думаю что они ее вообще решали, и скорее всего этим занимается ОС плевав на пенальти пересылки. ....Во вторых, для 6-канальных xeon да, нет смысла брать 24-ядерные версии, т.к. 14 ядер уже загонят в насыщение 6-канальный контроллер памяти. Блин. вы точно развернулись на 180 градусов. Где тут противоречие с тем что я пишу? Или вы спорите просто для того чтобы спорить. >Стараюсь не делать этого для тех , кто назначает любой аргумент бредом сивый кобылы потмоу что без ссылок - это бред сивой кобылы. Т.к. противоречит элементарным принципам которым нас со второго курса учили.
  15. З.Ы. если хотите качественно аргументировать документами, есть такой стиль, указывать точные ссылки на материал, а не сыпать непонятными картинками вне контекста. >во всяком случае у CST, использует AVX2 только на коротком подготовительном этапе расчета AFAIK, HFSS давно использует AVX2 и AVX-512 в DrivenModal. Сложности HFSS всегда были как раз на генерации меша и препроцессинге, в которые упирается решение маленьких задач меньше 8Гб объемом.