Перейти к содержанию
    

9 hours ago, Alexey_N said:

Пытаюсь запустить Tesla K40, что-то не получается :(.
У кого-нибудь есть опыт включения такой карточки?

Вы бы написали, что делали и читали ли http://updates.cst.com/downloads/GPU_Computing_Guide_2018.pdf

что показывает nvidia-smi ?

А так по памяти:

1. Настроить в биосе работу с карточками с памятью более 4ГБ

для примера http://manuals.ts.fujitsu.com/file/11242/gpgpu-nvidia-k20-qig-en.pdf

2. Установить драйвер для Тесла

3. В командной строке с помощью nvidia-smi  переключить карту в режим расчетчика (Tesla Compute Cluster (TCC) Mode)

 

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

4 hours ago, Y.Kolmakov said:

Вы бы написали, что делали и читали ли http://updates.cst.com/downloads/GPU_Computing_Guide_2018.pdf

что показывает nvidia-smi ?

Да, спасибо большое за ответ, - это прекрасно, что хоть кто-то их заводил!

Значит ПДФ я прочёл, но это уже о применении к CST, в моём случае я до этого ещё не дошёл, облом происходит похоже на уровне БИОСа.

Собственно БИОС пишет, что какая-то ошибка происходит на PCI/PCI-E и он устройство отключает.

В винде (10х64) это выглядит так: Диспетчер устройств рисует NVIDEA Tesla K40m с желтым треугольничком и даёт диагноз: "Недостаточно свободных ресурсов для работы данного устройства. (Код 12)"

Разумеется nvidia-smi тоже обламывается: Ошибка инициализации по неизвестной причине.

Системная плата - ASUS Z170-A, вроде бы не очень старая, смотрел на другом компе - та же картина... Может эта карточка не со всеми матерями совместима?

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

17 minutes ago, Alexey_N said:

Собственно БИОС пишет, что какая-то ошибка происходит на PCI/PCI-E и он устройство отключает.

 

надо включить

Above 4G Decoding

см. стр. 105

https://dlcdnets.asus.com/pub/ASUS/mb/LGA1151/Z170-A/E10611_Z170-A_UM_V2_WEB.pdf

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

6 hours ago, Y.Kolmakov said:

надо включить

Above 4G Decoding

см. стр. 105

https://dlcdnets.asus.com/pub/ASUS/mb/LGA1151/Z170-A/E10611_Z170-A_UM_V2_WEB.pdf

Супер! Действительно эта хреновина была запрятана в разделе BOOT, ну кто бы мог подумать...
Всё заработало.
СПАСИБО!!!

ЗЫ. И опять же, в который раз, приходится пожалеть, что наш любимый форум не позволяет отгружать пиво онлайн ;).

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

Комп: i7-7700K (4500MHz), ОЗУ = 64ГБ, Винда 10.

Проверялось в трех солверах: Time, Freq, Integral, для расчета простенькой рупорной антеннки.
Предварительный результат неоднозначный.

С Временным солвером в общем и так всё летает, так что пришлось специально утяжелять параметры расчета, чтобы заценить разницу. Разница существенная - примерно 5 раз (3 мин против 15 мин).

С Частотным солвером использование графического ускорителя не предусмотрено в CST (а он-то реально медленный).

С Интегральным (этот - вообще самый медленный) галочка включения ускорителя есть, но реально он там почти не работает - смотрел график загрузки карты в окошке от Nvidia.

Так что вот, вопрос о целесообразности Теслы пока не очевиден...

Да, и 64ГБ памяти там ни разу не используется, максимум гиг 8, судя по диспетчеру задач.

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

Alexey_N

Для простых по размеру задач ускорители могут быть не выгодны.

Большие PIC проекты ускоряются хорошо. И тут, скорее памяти ускорителя может не хватать.

 

 

Изменено пользователем TitovVN1974

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

7 часов назад, Alexey_N сказал:

Так что вот, вопрос о целесообразности Теслы пока не очевиден...

Не очевиден "для простой рупорной антенны". А если эту простую рупорную антенну соединить с параболическим отражателем на десяток лямбд с гибридным решением (с различными асимптотическими решателями- shooting & bouncing rays, physical optics, MoM) то ускорение может быть на порядки.

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

44 минуты назад, yurik82 сказал:

Не очевиден "для простой рупорной антенны". А если эту простую рупорную антенну соединить с параболическим отражателем на десяток лямбд с гибридным решением (с различными асимптотическими решателями- shooting & bouncing rays, physical optics, MoM) то ускорение может быть на порядки.

Ускорение на порядки никак не будет с этой Tesla K40 картой (из слабых она на сегодня), посмотрите что дает кластер из 8 карт максимум порядок, +/- еще чуть.

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

p.s. ускорители с медленным fp64, тем не менее, ускоряют PIC. CPU при этом загружен полностью.

к примеру, код fbpic - работает на GPU с низкой загрузкой CPU.

=> вопрос, интересно, ускорение PIC в CST на GPU с быстрыми fp64 - будет соответствовать,

соотношению производительности fp32  на соответствующих картах (с быстрым и и медленным fp64), или будет быстрее?

и будет ли загружен CPU ?

Изменено пользователем TitovVN1974
уточнение

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

Правильно ли я понимаю, что модуль Filter designer 3D, физически не  синтезирует сам фильтр (как 2D filer), а является оценочным инструментом для расчетов?

Заранее благодарен за ответ

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

Filter designer 3D не выдает геометрические размеры. Он синтезирует матрицу связи. Подробности о матрице связи см. в следующей статье (а также см. список литературы): R.J. Cameron "Advanced coupling matrix synthesis techniques for microwave filters".

Смысл в том, что элементы связи (их геометрические размеры) можно считать по отдельности (хотя бы в первом приближении), что значительно ускоряет и упрощает расчет. Кроме того, Filter designer 3D может определять матрицу связи по результатам расчетов/измерений и сравнивать её с расчетной. Это позволяет определять в каком именно месте надо изменять фильтр для получения нужных характеристик. См. CST-Filter-Designer-3D-web.pdf.

И да, он является хорошим оценочным инструментом.

 

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

Попробовал использовать видеокарту GTX1060 3GB  с процессором i-7 5820k @4GHz + 32Gb RAM  Win7 в Time Domain для раcчёта фильтров. Сокращение времени расчета с GPU в 1,8...2,4 раза в зависимости от типа фильтра (объёма задачи). Ускорение более заметно при количестве кубиков в сетке от 1 млн. и больше.  Наверно надо ставить 2 видеокарты или майнинг ферму покупать.

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

freeport

Или попробовать другую видеокарту. Насколько эффективны будут несколько видеокарт - не знаю, заработают ли карты 2000 серии, не знаю. 

p. s.  Ускоряется само нестационарное моделирование,  расчет матриц не ускоряется. 

Изменено пользователем TitovVN1974
уточнение

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

А при использовании GPU CST сообщает как то, что памяти видеокарты не хватает? У меня сложилось впечатление, что продолжает считать, но гораздо медленнее (видно что загрузки CPU нет, а GPU молотит) и никаких сообщений не выдает. Какой у кого опыт?

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

Присоединяйтесь к обсуждению

Вы можете написать сейчас и зарегистрироваться позже. Если у вас есть аккаунт, авторизуйтесь, чтобы опубликовать от имени своего аккаунта.

Гость
Ответить в этой теме...

×   Вставлено с форматированием.   Вставить как обычный текст

  Разрешено использовать не более 75 эмодзи.

×   Ваша ссылка была автоматически встроена.   Отображать как обычную ссылку

×   Ваш предыдущий контент был восстановлен.   Очистить редактор

×   Вы не можете вставлять изображения напрямую. Загружайте или вставляйте изображения по ссылке.

×
×
  • Создать...