Aner 0 Posted February 3, 2020 · Report post Найди книгу по CST под ред. Курушин А.А. на русском. Там есть основы. Второй путь - учись делать правильные запросы у гугля, яндекса и тп. Тебе тут нужна емкость С, не ошибись со значением, оно в Farada_х Quote Ответить с цитированием Share this post Link to post Share on other sites
exenyus 0 Posted March 10, 2020 · Report post В 08.08.2019 в 11:48, Y.Kolmakov сказал: А при использовании GPU CST сообщает как то, что памяти видеокарты не хватает? У меня сложилось впечатление, что продолжает считать, но гораздо медленнее (видно что загрузки CPU нет, а GPU молотит) и никаких сообщений не выдает. Какой у кого опыт? А вы видеокарты в sli подключали или просто параллельно? PCI разъемы все x16? И вопрос от меня - я подключил две видеокарты 1050ti и они загружаются только на 50%, то есть нет никакого профита от использования двух видеокарт, так как по времени они считают ровно так же, как и одна, сталкивался кто нибудь с такой проблемой? Quote Ответить с цитированием Share this post Link to post Share on other sites
Y.Kolmakov 0 Posted March 10, 2020 · Report post Just now, exenyus said: А вы видеокарты в sli подключали или просто параллельно? PCI разъемы все x16? Это у меня был опыт с одной Tesla K40, большая задача на PIC солвере. Еще вот попробовал расчет во времени на GTX1660, простая задача во временной области - загрузки карты толком нет (10-15%), но что то там явно считает. Прирост не смотрел. Quote Ответить с цитированием Share this post Link to post Share on other sites
exenyus 0 Posted March 10, 2020 (edited) · Report post 8 минут назад, Y.Kolmakov сказал: Это у меня был опыт с одной Tesla K40, большая задача на PIC солвере. Еще вот попробовал расчет во времени на GTX1660, простая задача во временной области - загрузки карты толком нет (10-15%), но что то там явно считает. Прирост не смотрел. Извиняюсь, вопрос был не к вам) В 09.08.2019 в 11:28, demonis сказал: Поделюсь своим исследование эффективности ускорителей - Сам компьютер двухпроцессорный Xeon в сумме 24 ядра. Ускорители - Tesla K40. Больше всего прироста дает один ускоритель, третий дает очень мало прироста, если только нет ограничения по памяти в ускорителе. Ускоряется только расчет - подготовка матрицы делается на процессорах. Потому быстрый процессор и их количество важны, если планируется многократный просчет модели. ~ 8 Million mesh cells ~ 30 Million mesh cells ~ 210 Million mesh cells Вопрос был к вам, посмотрите сообщение выше пожалуйста и в лс вам написал) 13 минут назад, Y.Kolmakov сказал: Это у меня был опыт с одной Tesla K40, большая задача на PIC солвере. Еще вот попробовал расчет во времени на GTX1660, простая задача во временной области - загрузки карты толком нет (10-15%), но что то там явно считает. Прирост не смотрел. Странно что у вас на GTX1660 так слабо видеокарта загружается, я считал методом частиц (PIC) с использованием RTX2080 SUPER, ускорение расчета было в 9 раз относительно расчета на процессоре (ryzen 3800x) Edited March 10, 2020 by exenyus Quote Ответить с цитированием Share this post Link to post Share on other sites
Zubex 0 Posted April 16, 2020 · Report post добрый всем! не могу разобраться как подключить GPU для расчетов. помогите готов продонатить специалисту. To enable such GPUs, set the environment variableCSTHWACCALLOWUNVERIFIEDHARDWARE= 1. Then all eligible installed and visible Nvidia GPUs will beconsidered for computation.You can limit the visible devices by using the environment variableCUDAVISIBLEDEVICES Quote Ответить с цитированием Share this post Link to post Share on other sites
TitovVN1974 0 Posted April 16, 2020 · Report post Zubex {Windows 10}: Панель управления -> Система -> Дополнительные параметры системы -> Переменные среды Системные переменные: Создать. Имя переменнной: CST_HWACC_ALLOW_UNVERIFIED_HARDWARE Значение: 1 Перезагрузите машину. Quote Ответить с цитированием Share this post Link to post Share on other sites
Zubex 0 Posted April 16, 2020 · Report post 2 minutes ago, TitovVN1974 said: Zubex {Windows 10}: Панель управления -> Система -> Дополнительные параметры системы -> Переменные среды Системные переменные: Создать. Имя переменнной: CST_HWACC_ALLOW_UNVERIFIED_HARDWARE Значение: 1 Перезагрузите машину. quadro 600 работать будет? я понимаю что карта дно)))) напишите мне в личку. спасибо Quote Ответить с цитированием Share this post Link to post Share on other sites
semen_992 0 Posted April 17, 2020 · Report post Коллеги, подскажите, что для CST (Tet Mesh, Frequency Solver) лучше взять? AMD Ryzen Threadripper 3990X или 3970X? Или может быть за эти деньги лучше взять что-нибудь от интела и получить бОльшую производительность? Quote Ответить с цитированием Share this post Link to post Share on other sites
TitovVN1974 0 Posted April 17, 2020 (edited) · Report post semen_992 желательно протестировать Ваши задачи на соответствующих процесорах. могу запустить на i9-10940x {стандартный турбобуст Интел, Noctua NH-D15}, 64GB@3000 в CST 2019 sp4 Edited April 17, 2020 by TitovVN1974 software version Quote Ответить с цитированием Share this post Link to post Share on other sites
semen_992 0 Posted April 17, 2020 · Report post 2 minutes ago, TitovVN1974 said: semen_992 желательно протестировать Ваши задачи на соответствующих процесорах. могу запустить на i9-10940x {стандартный турбобуст Интел, Noctua NH-D15}, 64GB@3000. так вот с удовольствием бы запустил - где ж его взять только? :) 10940x - хороший, но тот, что я рассматриваю имеет несколько больше ядрышек... Quote Ответить с цитированием Share this post Link to post Share on other sites
freeport 0 Posted April 17, 2020 · Report post Однозначно надо брать АМД. Но сравнивать надо цену и производительность. Сравнивал разогнанный i7-5820k и Райзен 2700. Сначала в тесте CineBench. Разница составила 25% в пользу АМД. Затем запускал одну и ту же задачу на обоих компах в CST. Время расчета у АМД было меньше на те же 25%. Тесты CineBench и другой синтетики можно посмотреть здесь и сравнить https://www.cpu-monkey.com/en/compare_cpu-amd_ryzen_9_3900x-931-vs-intel_core_i9_10940x-967 . Или здесь https://www.chaynikam.info/cpu_comparison.html?Ryzen_9_3900X&Core_i9-10940Xconf2=Intel`0````LGA2066`` При примерно одинаковой производительности АМД 3900x дешевле чем 10940x более чем в 2 раза. Преимущества многоядерности особенно видны при расчёте в Time Domain. Во Frequency Domain больше нужна частота процессора, там процесс хуже распараллеливается. Что касается видеокарт, то на старой NVIDIA Quadro K2000 (2013г.) расчёт идёт в разы медленней, чем без неё. На RTX2070 получал ускорение чуть ли не в 5 раз, однако только на больших задачах, где разбиение больше 1 миллиона кубиков. А если тысяч 200 кубиков, то без видеокарты быстрее. Quote Ответить с цитированием Share this post Link to post Share on other sites
semen_992 0 Posted April 18, 2020 · Report post 14 hours ago, freeport said: Однозначно надо брать АМД. Но сравнивать надо цену и производительность. Сравнивал разогнанный i7-5820k и Райзен 2700. Сначала в тесте CineBench. Разница составила 25% в пользу АМД. Затем запускал одну и ту же задачу на обоих компах в CST. Время расчета у АМД было меньше на те же 25%. Тесты CineBench и другой синтетики можно посмотреть здесь и сравнить https://www.cpu-monkey.com/en/compare_cpu-amd_ryzen_9_3900x-931-vs-intel_core_i9_10940x-967 . Или здесь https://www.chaynikam.info/cpu_comparison.html?Ryzen_9_3900X&Core_i9-10940Xconf2=Intel`0````LGA2066`` При примерно одинаковой производительности АМД 3900x дешевле чем 10940x более чем в 2 раза. Преимущества многоядерности особенно видны при расчёте в Time Domain. Во Frequency Domain больше нужна частота процессора, там процесс хуже распараллеливается. Что касается видеокарт, то на старой NVIDIA Quadro K2000 (2013г.) расчёт идёт в разы медленней, чем без неё. На RTX2070 получал ускорение чуть ли не в 5 раз, однако только на больших задачах, где разбиение больше 1 миллиона кубиков. А если тысяч 200 кубиков, то без видеокарты быстрее. Спасибо за развернутый ответ! Все же, если я считаю во Frequency Domain, есть хоть какой-то смыл от бОльшего количества ядер? Иль лучше взять 4 ядра и раскочегарить его на 5 ГГц? Quote Ответить с цитированием Share this post Link to post Share on other sites
yurik82 0 Posted April 18, 2020 · Report post 2 часа назад, semen_992 сказал: Все же, если я считаю во Frequency Domain, есть хоть какой-то смыл от бОльшего количества ядер? Иль лучше взять 4 ядра и раскочегарить его на 5 ГГц? Параметрические и частотные свипы - параллелятся на любое количество ядер или даже распределенных машин Quote Ответить с цитированием Share this post Link to post Share on other sites
TitovVN1974 0 Posted April 18, 2020 · Report post 43 minutes ago, yurik82 said: Параметрические и частотные свипы - параллелятся на любое количество ядер или даже распределенных машин В случае распараллеливания по ядрам скорость будет расти, пока не будет достигнут "потолок" ограниченный пропускной способностью памяти. Quote Ответить с цитированием Share this post Link to post Share on other sites
freeport 0 Posted April 18, 2020 · Report post 8 hours ago, yurik82 said: Параметрические и частотные свипы - параллелятся на любое количество ядер или даже распределенных машин Откуда такой вывод? У вас есть CST? Вот запустите одну и ту же задачу во Frequency и Time Domain и посмотрите загрузку ядер процессора в диспетчере задач, и сразу увидите, что во Frequency Domain ядра не загружены, по сравнению с Time Domain, где загрузка почти постоянно 50%. semen 992 4 ядра это слишком мало в наше время, больше ядер будет быстрее. Недостаток Time Domain - невозможность расчёта больших затуханий (больше 80дБ), при этом точность расчета такая же как во Frequency Domain, а скорость счета выше. Ещё пробовал сравнивать скорость расчёта на 2-процессорном компе с 16 физическими ядрами (2 процессора Xeon по 8 ядер в каждом) и древним 6-и ядерным 3930к. Цифры уже точно не помню, но при расчёте в Time Domain скорость на Xeon была в разы быстрей по сравнению с 3930к, а вот во Frequency Domain всего лишь на 20% быстрей. Quote Ответить с цитированием Share this post Link to post Share on other sites