Jump to content

    
Pir0texnik

Вопросы по CST

Recommended Posts

Найди книгу по CST под ред. Курушин А.А. на русском. Там есть основы. Второй путь - учись делать правильные запросы у гугля, яндекса и тп.

Тебе тут нужна емкость С, не ошибись со значением, оно в Farada_х

591_20617_a4c2aabfbfb32f5.jpg

Share this post


Link to post
Share on other sites
В 08.08.2019 в 11:48, Y.Kolmakov сказал:

А при использовании GPU CST сообщает как то, что памяти видеокарты не хватает? У меня сложилось впечатление, что продолжает считать, но гораздо медленнее (видно что загрузки CPU нет, а GPU молотит) и никаких сообщений не выдает. Какой у кого опыт?

А вы видеокарты в sli подключали или просто параллельно? PCI разъемы все x16? И вопрос от меня - я подключил две видеокарты 1050ti и они загружаются только на 50%, то есть нет никакого профита от использования двух видеокарт, так как по времени они считают ровно так же, как и одна, сталкивался кто нибудь с такой проблемой?

Share this post


Link to post
Share on other sites
Just now, exenyus said:

А вы видеокарты в sli подключали или просто параллельно? PCI разъемы все x16?

Это у меня был опыт с одной Tesla K40, большая задача на PIC солвере. Еще вот попробовал расчет во времени на GTX1660, простая задача во временной области - загрузки карты толком нет (10-15%), но что то там явно считает. Прирост не смотрел.

Share this post


Link to post
Share on other sites
8 минут назад, Y.Kolmakov сказал:

Это у меня был опыт с одной Tesla K40, большая задача на PIC солвере. Еще вот попробовал расчет во времени на GTX1660, простая задача во временной области - загрузки карты толком нет (10-15%), но что то там явно считает. Прирост не смотрел.

Извиняюсь, вопрос был не к вам)

В 09.08.2019 в 11:28, demonis сказал:

 

Поделюсь своим исследование эффективности ускорителей - Сам компьютер двухпроцессорный Xeon в сумме 24 ядра. Ускорители - Tesla K40.

Больше всего прироста дает один ускоритель, третий дает очень мало прироста, если только нет ограничения по памяти в ускорителе.

Ускоряется только расчет - подготовка матрицы делается на процессорах. Потому быстрый процессор и их количество важны, если планируется многократный просчет модели.

~ 8 Million mesh cells 

image.png.dab1f9a2d0f8f6af56e25f36557308f5.png

~ 30 Million mesh cells 

image.png.be7974b59b7dd9669c9c64cf4ce17c5e.png

~ 210 Million mesh cells 

image.png.b6ed3ad3c45a55f777440fc4c14f1368.png

Вопрос был к вам, посмотрите сообщение выше пожалуйста и в лс вам написал)

13 минут назад, Y.Kolmakov сказал:

Это у меня был опыт с одной Tesla K40, большая задача на PIC солвере. Еще вот попробовал расчет во времени на GTX1660, простая задача во временной области - загрузки карты толком нет (10-15%), но что то там явно считает. Прирост не смотрел.

Странно что у вас на GTX1660 так слабо видеокарта загружается, я считал методом частиц (PIC) с использованием RTX2080 SUPER, ускорение расчета было в 9 раз относительно расчета на процессоре (ryzen 3800x)

Edited by exenyus

Share this post


Link to post
Share on other sites

добрый всем! не могу разобраться как подключить GPU для расчетов. помогите готов продонатить специалисту.

To enable such GPUs, set the environment variableCSTHWACCALLOWUNVERIFIEDHARDWARE= 1. Then all eligible installed and visible Nvidia GPUs will beconsidered for computation.You can limit the visible devices by using the environment variableCUDAVISIBLEDEVICES

Share this post


Link to post
Share on other sites

Zubex

{Windows 10}:

Панель управления -> Система -> Дополнительные параметры системы -> Переменные среды

Системные переменные: Создать.

Имя переменнной: CST_HWACC_ALLOW_UNVERIFIED_HARDWARE

Значение: 1

Перезагрузите машину.

 

 

Share this post


Link to post
Share on other sites
2 minutes ago, TitovVN1974 said:

Zubex

{Windows 10}:

Панель управления -> Система -> Дополнительные параметры системы -> Переменные среды

Системные переменные: Создать.

Имя переменнной: CST_HWACC_ALLOW_UNVERIFIED_HARDWARE

Значение: 1

Перезагрузите машину.

 

 

quadro 600 работать будет? я понимаю что карта дно)))) напишите мне в личку. спасибо

Share this post


Link to post
Share on other sites

Коллеги, подскажите, что для CST (Tet Mesh, Frequency Solver) лучше взять?

AMD Ryzen Threadripper 3990X или 3970X? Или может быть за эти деньги лучше взять что-нибудь от интела и получить бОльшую производительность?

Share this post


Link to post
Share on other sites

semen_992

желательно протестировать Ваши задачи на соответствующих процесорах.

могу запустить на i9-10940x {стандартный турбобуст Интел, Noctua NH-D15}, 64GB@3000

в CST 2019 sp4

Edited by TitovVN1974
software version

Share this post


Link to post
Share on other sites
2 minutes ago, TitovVN1974 said:

semen_992

желательно протестировать Ваши задачи на соответствующих процесорах.

могу запустить на i9-10940x {стандартный турбобуст Интел, Noctua NH-D15}, 64GB@3000.

так вот с удовольствием бы запустил - где ж его взять только? :)

10940x - хороший, но тот, что я рассматриваю имеет несколько больше ядрышек...

Share this post


Link to post
Share on other sites

     Однозначно надо брать АМД. Но сравнивать надо цену и производительность.  Сравнивал разогнанный i7-5820k и Райзен 2700. Сначала в тесте  CineBench. Разница составила 25% в пользу АМД. Затем запускал одну и ту же задачу на обоих компах в CST. Время расчета у АМД было меньше на те же 25%. Тесты CineBench  и другой синтетики можно посмотреть здесь  и сравнить https://www.cpu-monkey.com/en/compare_cpu-amd_ryzen_9_3900x-931-vs-intel_core_i9_10940x-967 .  Или здесь https://www.chaynikam.info/cpu_comparison.html?Ryzen_9_3900X&Core_i9-10940Xconf2=Intel`0````LGA2066`` При примерно одинаковой производительности АМД 3900x дешевле чем 10940x более чем в 2 раза. Преимущества многоядерности особенно видны при расчёте в Time Domain. Во Frequency Domain больше нужна частота процессора, там процесс хуже распараллеливается.

     Что касается видеокарт, то на старой NVIDIA Quadro K2000 (2013г.) расчёт идёт в разы медленней, чем без неё. На RTX2070 получал ускорение чуть ли не в 5 раз, однако только на больших задачах, где разбиение больше 1 миллиона кубиков. А если  тысяч 200 кубиков, то без видеокарты быстрее.

 

 

Share this post


Link to post
Share on other sites
 
 
 
 
14 hours ago, freeport said:

     Однозначно надо брать АМД. Но сравнивать надо цену и производительность.  Сравнивал разогнанный i7-5820k и Райзен 2700. Сначала в тесте  CineBench. Разница составила 25% в пользу АМД. Затем запускал одну и ту же задачу на обоих компах в CST. Время расчета у АМД было меньше на те же 25%. Тесты CineBench  и другой синтетики можно посмотреть здесь  и сравнить https://www.cpu-monkey.com/en/compare_cpu-amd_ryzen_9_3900x-931-vs-intel_core_i9_10940x-967 .  Или здесь https://www.chaynikam.info/cpu_comparison.html?Ryzen_9_3900X&Core_i9-10940Xconf2=Intel`0````LGA2066`` При примерно одинаковой производительности АМД 3900x дешевле чем 10940x более чем в 2 раза. Преимущества многоядерности особенно видны при расчёте в Time Domain. Во Frequency Domain больше нужна частота процессора, там процесс хуже распараллеливается.

     Что касается видеокарт, то на старой NVIDIA Quadro K2000 (2013г.) расчёт идёт в разы медленней, чем без неё. На RTX2070 получал ускорение чуть ли не в 5 раз, однако только на больших задачах, где разбиение больше 1 миллиона кубиков. А если  тысяч 200 кубиков, то без видеокарты быстрее.

 

 

Спасибо за развернутый ответ!

Все же, если я считаю во Frequency Domain, есть хоть какой-то смыл от бОльшего количества ядер? Иль лучше взять 4 ядра и раскочегарить его на 5 ГГц?

Share this post


Link to post
Share on other sites
2 часа назад, semen_992 сказал:

Все же, если я считаю во Frequency Domain, есть хоть какой-то смыл от бОльшего количества ядер? Иль лучше взять 4 ядра и раскочегарить его на 5 ГГц?

Параметрические и частотные свипы - параллелятся на любое количество ядер или даже распределенных машин

Share this post


Link to post
Share on other sites
43 minutes ago, yurik82 said:

Параметрические и частотные свипы - параллелятся на любое количество ядер или даже распределенных машин

В случае распараллеливания по ядрам скорость будет расти, пока не будет достигнут "потолок" ограниченный пропускной способностью памяти.

Share this post


Link to post
Share on other sites
8 hours ago, yurik82 said:

Параметрические и частотные свипы - параллелятся на любое количество ядер или даже распределенных машин

Откуда такой вывод? У вас есть CST? Вот запустите одну и ту же задачу во Frequency и Time Domain и посмотрите загрузку ядер процессора в диспетчере задач, и сразу увидите, что во Frequency Domain ядра не загружены, по сравнению с Time Domain, где загрузка почти постоянно 50%.

semen 992

4 ядра это слишком мало в наше время, больше ядер будет быстрее. Недостаток Time Domain - невозможность расчёта больших затуханий (больше 80дБ), при этом точность расчета такая же как во Frequency Domain,  а  скорость счета выше. Ещё пробовал сравнивать скорость расчёта  на 2-процессорном компе с 16 физическими ядрами (2 процессора Xeon по 8 ядер в каждом) и древним 6-и ядерным 3930к. Цифры уже точно не помню, но при расчёте в Time Domain скорость на Xeon была в разы быстрей по сравнению с 3930к, а вот во Frequency Domain всего лишь на 20% быстрей.

Share this post


Link to post
Share on other sites

Join the conversation

You can post now and register later. If you have an account, sign in now to post with your account.

Guest
Reply to this topic...

×   Pasted as rich text.   Paste as plain text instead

  Only 75 emoji are allowed.

×   Your link has been automatically embedded.   Display as a link instead

×   Your previous content has been restored.   Clear editor

×   You cannot paste images directly. Upload or insert images from URL.