Перейти к содержанию
    

9 часов назад, Freesom сказал:

Высокая частота памяти это всегда хорошо, тут прямая зависимость. С каналами не всё так тривиально. У интела для того чтобы насытить 4-х канальный контроллер памяти DDR4 нужно около 10 ядер процессора, поэтому для 6-ядерного процессора это избыток, а 16-ядерник будет всегда зажат именно контроллером памяти. Потому и ушли на 6-ти канальные.

Ой, возможно забыл упомянуть, что Проц тоже на замену) Свап на 6...12 ядер.
Обновил пост выше.

 

UPD А в HFSS не стоит ограничение на ядра? И для доп. ядер нужна спец. лицензия? Или я с другим ПО путаю.

Изменено пользователем Pubzor

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

15 hours ago, Pubzor said:

Что имеет большую значимость в железе для HFSS: многоканальность памяти или частота памяти? 

 

В случае 12 ядер, думаю ни то ни другое не дадут увеличения прироста более 5%

Ниже картинки с подобными тестами, правда не для HFSS, но зависимость должна быть похожа.

Особого смысла гнаться за этими показателями нет, частота 2400-2666 и 2-4 канала вполне достаточно в вашем случае.

Лишнее лучше потратить на более высокие частоты CPU и хороший SSD.

Spoiler

image.thumb.png.3d4f612ad8693e14bc6b2d2e50b6e0b3.png

image.thumb.png.02d122de6c479b84e8158f3176d84916.png

image.thumb.png.3bfbca76c0331837e69aabde9b69face.png

 

14 hours ago, Pubzor said:

UPD А в HFSS не стоит ограничение на ядра? И для доп. ядер нужна спец. лицензия? Или я с другим ПО путаю.

 

Включено 4 ядра, чтобы использовать больше нужны дополнительные лицензии.

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

Есть специализированные машины, именно для продуктов ANSYS, не только для HFSS. Посмотрите, какое там железо стоит.

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

1 час назад, Джоконда сказал:

Есть специализированные машины, именно для продуктов ANSYS, не только для HFSS. Посмотрите, какое там железо стоит.

Ну вот я оттуда и начал. А потом полезли вопросы. В рекомендациях за разные годы по железу такие требования:

Скрытый текст
Электромагнитные вычислительные модули. EBU

Intel XEON Gold, Platinum, Bronze – 61xx, 81xx, 31xx серии. Рекомендуется рассматривать процессоры с высокой тактовой частотой, но не обязательно с наибольшей.

Замечание. ANSYS HFSS в основном использует вычисления в рамках ядра (in-core mode), в этом случае данные полностью находятся в оперативной памяти, поэтому очень важна тактовая частота и скорость ОЗУ.

  • Отключить Hyper-threading
  • Включить Turbo boost

ОЗУ (наибольшая тактовая частота, например, DDR-4 2666 MHz)

  • Чтобы работать на максимальной скорости, все каналы памяти в процессорах должны быть обеспечены одинаковым объемом установленной ОЗУ. Оптимальным считается минимальный объём оперативной памяти на машину 192 ГБ.
  • Желательно иметь 8Гб ОЗУ на каждое ядро процессора для электромагнитных модулей

Интерконнект   

  • Для работы с двумя и более вычислительными узлами в параллель необходимо использовать высокопроизводительную сеть передачи данных Omni-Path, QDR или FDR IB.

Жёсткий диск

  • SSD диски (SATA, SAS или NVMe интерфейсов). Рекомендуется использовать локальный диск для размещения временных файлов во время решения.

Графика

  • Nvidia Quadro P1000, P2000, P4000, P5000

GPU (ANSYS HFSS, Maxwell, Matrix solver)

  • Список протестированных графических ускорителей в среде ANSYS

На 8 ядер на Ксенонах в переделах бюджета на 4к ОЗУ трудновато найти что-то более 2666МГц. Насколько важно количество каналов памяти. Может, ксеноны нужны из-за большого КЕШа?

Изменено пользователем Pubzor

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

5 minutes ago, Pubzor said:
 
Электромагнитные вычислительные модули. EBU

Intel XEON Gold, Platinum, Bronze – 61xx, 81xx, 31xx серии. Рекомендуется рассматривать процессоры с высокой тактовой частотой, но не обязательно с наибольшей.

Замечание. ANSYS HFSS в основном использует вычисления в рамках ядра (in-core mode), в этом случае данные полностью находятся в оперативной памяти, поэтому очень важна тактовая частота и скорость ОЗУ.

  • Отключить Hyper-threading
  • Включить Turbo boost

ОЗУ (наибольшая тактовая частота, например, DDR-4 2666 MHz)

  • Чтобы работать на максимальной скорости, все каналы памяти в процессорах должны быть обеспечены одинаковым объемом установленной ОЗУ. Оптимальным считается минимальный объём оперативной памяти на машину 192 ГБ.
  • Желательно иметь 8Гб ОЗУ на каждое ядро процессора для электромагнитных модулей

Интерконнект   

  • Для работы с двумя и более вычислительными узлами в параллель необходимо использовать высокопроизводительную сеть передачи данных Omni-Path, QDR или FDR IB.

Жёсткий диск

  • SSD диски (SATA, SAS или NVMe интерфейсов). Рекомендуется использовать локальный диск для размещения временных файлов во время решения.

Графика

  • Nvidia Quadro P1000, P2000, P4000, P5000

GPU (ANSYS HFSS, Maxwell, Matrix solver)

  • Список протестированных графических ускорителей в среде ANSYS

На 8 ядер на Ксенонах в переделах бюджета на 4к ОЗУ трудновато найти что-то более 2666МГц. Насколько важно количество каналов памяти. Может, ксеноны нужны из-за большого КЕШа?

кэша надо меньше - он создает задержки

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

23 минуты назад, Джоконда сказал:

 А Вы хотите собрать компьютер для расчетов в HFSS? 

Да, остальные модули ANSYS мне не нужны.
Ещё иногда пользуюсь Microwave office, там тоже пару раз испытывал недостаток скорости из-за загруженности процессора. По памяти там вроде всё ОК. Но приоритет HFSS, т.к. часто запускаю частотный свип, параметрический свип трёхмерных структур.


Freesomт.е. смотреть в строну меньшего КЭШа? Позже гляну, насколько помню у Ксенонах достаточно большой КЭШ относительно рядовых процев.

Изменено пользователем Pubzor

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

Только что, Pubzor сказал:

Да

А у вас сейчас комп не тянет? Сколько стоит ОЗУ? Кстати, там видеокарта еще должна влиять...

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

28 минут назад, Джоконда сказал:

А у вас сейчас комп не тянет? Сколько стоит ОЗУ? Кстати, там видеокарта еще должна влиять...

Отчего же? Тянет. Хочу быстрее. Хочу параллельно работать в нескольких приложениях. В том же Microwave Office.
Характеристики писал на прошлой странице:
Что имеет большую значимость в железе для HFSS: многоканальность памяти или частота памяти? Смотрю в сторону материнок, поддерживающих 4 канала вместо 2. Но что-то выше 2666 МГц среди 4к в связке Мать+Проц не особо нарисовывается при относительно разумном бюджете. Не низкая ли это частота в нынешнем тысячелетии?
Сейчас 6 ядер 3,4 ГГц, 32ГБ 2133MHz, хочется новый Проц и Память побольше и пошустрее, т.к. иногда ОЗУ полностью забивается, либо в диспетчере идёт медленный подъём заполненности ОЗУ (это влияние скорости ОЗУ?) при относительно свободном процессоре.

Видюха 2 ГБ. А она важна? Вроде как какие-то доп. настойки нужны для включения расчётов на GPU, но я с этим не заморачиваюсь.

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

23 часа назад, Pubzor сказал:

Что имеет большую значимость в железе для HFSS: многоканальность памяти или частота памяти? Смотрю в сторону материнок, поддерживающих 4 канала вместо 2. Но что-то выше 2666 МГц среди 4к в связке Мать+Проц не особо нарисовывается при относительно разумном бюджете. Не низкая ли это частота в нынешнем тысячелетии?

этот вопрос прямого отношения к HFSS не имеет, а к конкретной архитектуре железа. Где быстрее окажется ПСП зависит от конкретных архитектурных реализаций процессора/чипсета - сколько там ядер, NUMA или UMA, какая скорость (частота и ассоциативность) кешей процессора, регистровая или обычная ОЗУ. Где тест ПСП (типа AIDA) покажет больше Гб/сек и ниже задержки (в наносекундах) в общем случае не угадать. Надо смотреть конкретные процессоры.

 

23 часа назад, Pubzor сказал:

в диспетчере идёт медленный подъём заполненности ОЗУ (это влияние скорости ОЗУ?)

это не зависит от железа, а толлько от алгоритма HFSS и количества потоков которые он смог задейтвовать в даном конкретном расчёте. Что-то легко пареллетится, что-то не параллелится. Что-то может выполняться в несколько задач параллельно, но только при наличии достаточного объема ОЗУ чтобы одновременно считать несколько моделей (параметрический или частотный свип например).

Изменено пользователем yurik82

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

15 часов назад, Pubzor сказал:

Видюха 2 ГБ.

2 Гб видеокарты при 32 Гб ОЗУ - как-то очень несбалансированно, даже если не брать в расчет HFSS. Хотя-бы восьмерочку поставить. Кстати прочитал в интернете насчет рабочих станций для ANSYS, первое предложение было таким "В основе лежит мощная видеокарта..." Так что видеокарта влияет. 

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

On 7/14/2021 at 2:28 PM, Pubzor said:

т.е. смотреть в строну меньшего КЭШа? Позже гляну, насколько помню у Ксенонах достаточно большой КЭШ относительно рядовых процев.

Да, желательно меньшего. Я считаю в CST, но там частотный солвер этот тот же FEM, что и у HFSS, и точно так же какие-то этапы расчета распараллеливаются, какие-то нет. Кэш для FEM, как выяснилось, никчему, но под другие серверные задачи он что-то дает очевидно. Вон Empire XPU вообще целиком в кэше процов FDTD обсчитывает, а за счет скоростей, на которых кэш работает получается быстрее, чем на графических ускорителях. Затеял я как-то апгрейд с e5-1650v4 (6 ядер, 15 Мб кэша) на e5-2687wv4 (12 ядер, 30 Мб кэша). Суммарный прирост производительности в FEM что-то около 30%. Так что моя рекомендация такая: 8-10 ядер максимальной частоты и 4 канала памяти от 2400 МГц и выше. Ну а объем - сколько в бюджет влезет, кому-то 32 много, потому что задачи мелкие, кому-то 256 нехватает.

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

15.07.2021 в 06:43, Джоконда сказал:

2 Гб видеокарты при 32 Гб ОЗУ - как-то очень несбалансированно, даже если не брать в расчет HFSS. Хотя-бы восьмерочку поставить. Кстати прочитал в интернете насчет рабочих станций для ANSYS, первое предложение было таким "В основе лежит мощная видеокарта..." Так что видеокарта влияет. 

Что дали, с тем работали, лишь оперативы докинул. А точно нужна хорошая видеокарта? Не совсем понимаю как она в процессе расчётов участвует. Да, если модель сложная, то вертится иногда с притормаживанием, но мне терпимо. Но в Диспетчере задач я не вижу, чтобы видеокарта грузилась при расчётах.

 

В таком случае, есть ли смысл в апгрейде, если всё равно будут использоваться лишь 4 ядра?

Отжалел два денёчка. Взял более-менее ходовую у меня модель кое-что облегчил чтобы не ждать долго:
4частоты решения, сходимость 10%
21 частотная точка Дискретного свипа
3 параметрических свипа.
Без сохраненпия полей.

Запускал параметрические свипы при разных натсройках: количество задач и количество ядер. Периодически в рандомное время сохранял скриншоты загрузки проца. Не знаю, насколько они показательны.
В моменты меширования явных закономерностей в загрузке не выявил - абсолютно по разному ведут себя. Поэтому чаще скринил в момент частотного свипа.

image.thumb.png.3573441e2433fc673ae0bc1937d0b009.png

Да, при имеющихся 6 ядрах ставил и 8, и 12, и 24. Лично мои выводы по лично моей моделе, не факт что у кого-то так же будет:
Увеличение количества задач ведёт к увеличению времени решения. Что это вообще за параметр - Задачи?

Время анализа:

image.png.6128fe8804b9fac79d8eef107bfc32da.png

 

При 8 / 8 решилось почему-то только 2 Параметрических свипа за 40 мин., 1 ни в какую не хотел решаться.

 

Повторюсь, не заметил, чтобы GPU как-то загружался.

image.thumb.png.7f5e6be3b5de7fda495397b1b5874b31.png

Изменено пользователем Pubzor

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

19 minutes ago, Pubzor said:

Повторюсь, не заметил, чтобы GPU как-то загружался.

По поддерживаемым GPU см. https://www.ansys.com/content/dam/it-solutions/platform-support/gpu-accelerator-capabilities-2021-r2.pdf

Ранее GPU типа GeForce можно было задействовать только при использовании SBR+/Savant, сейчас про них не упоминается.

Надо проверять работают или нет.

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

16.07.2021 в 13:46, Pubzor сказал:

А точно нужна хорошая видеокарта?

 

Чтобы в этом был смысл, видеркарта нужна не просто хорошая, а специализированная. Если будет просто хорошая - прироста не получите. А если не будет вообще никакой - ну посчитаете за 1.5 часа вместо 1 часа на Tesla.

 

Скажем на примере Ansys Fluent, рекламируется что Quadro GV100 + 3 ядра может считать так же быстро как 6-ядерный процессор, но медленнее чем 8-ядерный. А связка 8 ядер CPU + GV100 равноценна 12-ядерному CPU

Т.е. видеокарта TDP=250W за $9000 вполне может заменить 3-4 ядра процессора ($100...$200) с TDP=35W

Изменено пользователем yurik82

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

Присоединяйтесь к обсуждению

Вы можете написать сейчас и зарегистрироваться позже. Если у вас есть аккаунт, авторизуйтесь, чтобы опубликовать от имени своего аккаунта.

Гость
Ответить в этой теме...

×   Вставлено с форматированием.   Вставить как обычный текст

  Разрешено использовать не более 75 эмодзи.

×   Ваша ссылка была автоматически встроена.   Отображать как обычную ссылку

×   Ваш предыдущий контент был восстановлен.   Очистить редактор

×   Вы не можете вставлять изображения напрямую. Загружайте или вставляйте изображения по ссылке.

×
×
  • Создать...