Перейти к содержанию
    

Какие САПР СВЧ поддерживают рассчеты на игровых картах?

Притащили мне ASUS GeForce GTX 1080 с целью ускорить расчеты :-) Но я посмотрел по основным программам (MWO, HFSS, FEKO...) и увидел только разговор про Tesla. А CUDA на простых картах кто-то поддерживает?

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

архитектура Tesla=Cuda

ATI=OpenCL

 

в графических картах есть два типа вычислительных ядер, 32 и 64 битные(двойной точности). Вторых в несколько раз меньше чем первых, за исключением карт Titan и самих Tesla как продукта, где соотношение single:double доходит до 2:1. Если речь о тесли как продукте, то сейчас она как и 1080 имеет итерацию "Pascal".

 

1080 сделан на итерации чипа GP104, как и Tesla P4

"One Pascal SM on the GP100 combines 64 single-precision (FP32) shader processors and also 32 double-precision (FP64) "

SM=Streaming Multiprocessor. В Тесле их вроде бы 60, т.е. нас интересуют 1920 64-разрядных исполнительных блока.

А в 1080 - не ясно. Но суюдя по всему, GFLOPs увеличены примерно пропорциональны частоте. Т.о. судя по всему, проме драйверов и объема памяти, 1080 практически идентичен Тесле P4.

 

Но есть одно но. Хорошо параллелятся и считаются на дискретных бордах только тайм-домейн методы. Для начала потому что ни меньше памяти занимают и легче разбиваются на домены. Полноволновые методы по моему никто серьезно еще на ускорителях не решал. Т.о. HFSS, в котором Transient поддерживаешь конечно ускорители, по основному своему FEM солверу отпадает, т.к. в нем задача может занимать и 60 и 100 гигабайт за раз, в зависимости от материалов и сложности модели. Остальные наверняка надо узнавать у производителя, какой солвер вам нужен и какой поддерживает.

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

Притащили мне ASUS GeForce GTX 1080 с целью ускорить расчеты :-) Но я посмотрел по основным программам (MWO, HFSS, FEKO...) и увидел только разговор про Tesla. А CUDA на простых картах кто-то поддерживает?

 

Можно посмотреть САПР Empire XPU. Очень быстро считает большие объекты, по сравнению с теми же MWO, HFSS...

Ей нужен CPU Intel, желательно i7, чем больше ядер, тем выше скорость. А тип графической карты не так важен.

 

Сравнивали недавно по точности расчетов с другими САПР - результаты очень близкие, при скорости вычислений в разы более высокой.

 

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

Хакать надо NVIDIa карты для для использования их в качестве ускорителя. http://www.eevblog.com/forum/chat/hacking-...l-counterparts/

 

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

Хакать надо NVIDIa карты для для использования их в качестве ускорителя. http://www.eevblog.com/forum/chat/hacking-...l-counterparts/

только там где тупой софт проверяет DevID.

 

Это не вина nVidia, а вина разработчиков софта. CUDA-C компилится под любой современный ускоритель nVidia. Иначе бы многие игры стояли в сторонке и поглядывали на AMD/ATI.

 

Традиционно, nVidia "хакают" не для CUDA, а для 3D графики Quadro. Quadro заточены на отображение проволок в CAD и на повышенное качество отрисовки, в ущерб производительности. Короче, другие оптимизации дров, да и сами дрова отдельные.

Во времена Riva GeForce 3, 4 чипы Quadro были идентичны игровым, только с лочками по DevID. Сейчас в игровых чипах пережигают аппаратно доступ к специализированных блокам используемым в CAD-ах, в.т.ч. антиалаясные проволоки и пр. Но iD все еще сменить можно. Как софтово(с глюками, но и возможностью откатить) так и перепайкой резисторов.

Изменено пользователем Hale

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

Так собственно вопрос, который всех волнует: кому-то удалось "перековать" игровую карту(пусть NVIDIA) таким образом, чтобы эффективно использовать ее в качестве ускорителя расчетов?

Применительно к CST, HFSS(только транзиент вроде?), ADS (там есть галочка...), MWO или Sonnet (они умеют в это вообще?).

Читая http://www.eevblog.com я так и не понял что поменялось после замены ID GTX980 на теслу...

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

CUDA поддерживает Savant. Метод расчета - трассировка лучей.

Видеокарты это хорошо умеют делать. Пробовал использовать Ge Force 650 ti, работало.

Сейчас Savant в составе Ansys Electromagnetics. Удобно использовать для быстрого анализа мест установки антенн.

 

Информация из справки:

 

GPU Hardware

 

The Savant GPU plug-in requires an NVIDIA GPU. Most recent NVIDIA GPUs (manufactured in the last three years) work well, with the best performance typically coming from the higher-end GTX, Quadro and Tesla cards. NVIDIA GPUs are produced for many different types of computers, including laptops, desktops and compute servers. The GPUs are also produced for many different market segments. This section provides an overview of many key concepts that are helpful to understand.

 

Please contact us if you have specific questions or would like us to recommend the best GPU to use with Savant for your application and budget.

 

NVIDIA GPU product lines

 

NVIDIA markets workstation GPUs in three different product lines. They market mobile GPUs in two different product lines.

 

GeForce or GTX: the consumer, desktop product line, focused on maximizing graphics-throughput for home users. These cards work well the Savant GPU plug-in. To maximize graphics refresh rates, the GeForce cards run at faster clock rates than other product lines. This leads to somewhat higher speed-up in Savant, but also produces more heat and may lead to higher error rates. As a result, NVIDIA recommends using Tesla cards for GPU compute servers. Sample GeForce model numbers include: GTX 670, 680, 750Ti, 770, 780, Titan, 960, 970, 980.

 

Tesla: the GPU compute server product line. Tesla GPUs run at slightly slower clocks to produce less heat and higher reliability. They also utilize ECC ram to detect and correct hardware memory errors. Tesla GPUs typically cost 3x to 4x more than comparable GeForce cards. Sample Tesla model numbers are K10, K20, K40. The Maxwell architecture is now available in the Tesla product line with models M40 and M60 but has not been tested with Savant. Pascal GPUs are available in the Tesla product line with models P4, P40, and P100 but have not been tested with Savant.

 

Quadro: the high-end visualization product line. These cards have the same GPU hardware as GTX and Tesla cards but are marketed to professional users. These cards tend to be more expensive than the GTX product line. They can work well with Savant GPU but the added cost of the Quadro may not translate to extra acceleration in Savant. A GTX card with the same internal hardware may provide the same level of acceleration at a lower price. Some Quadro cards have low numbers of processing cores and may not provide much speedup.

Mobile GPUs

 

NVIDIA sells mobile versions of GeForce and Quadro GPUs. The mobile versions typically have similar model numbers as the desktop versions, with an 'M' added to the model number. The mobile versions tend to have fewer cores and run at slower clock speeds, compromises that are necessary to reduce power consumption and heat. Savant GPU works well on recent mobile GPUs, but because of the hardware restrictions, it is not expected to achieve the same level of acceleration as it does on desktops and servers. Speed-ups of 8x to 15x are more typical for Savant GPU on mobile GPUs.

 

GPU architecture

 

There are different generations of GPU architecture. These are analogous to the CPU generations such as Pentium III, Pentium IV and most recently, Core I7. The NVIDIA GPU architectures from newest to oldest are Pascal, Maxwell, Kepler, and Fermi. Savant GPU performs well on all of them, but the best performance generally comes from the newer architectures. Savant GPU may run on GPUs from older architectures but may not perform well due to hardware limitations of those older GPUs.

 

Pascal: the current generation of NVIDIA GPU processor. Pascal processors generally have faster processing (GFLOPS/sec) and more memory than previous generations. Pascal also has much higher memory bandwidth (GB/sec) on the Tesla product line. Pascal GPUs are very new for Savant 18.0. Savant has not been tested on Pascal but should be compatible.

 

Maxwell: the previous generation of NVIDIA GPU processor. Maxwell processors generally contain more GPU cores, larger cache and other memory, and improved instruction scheduling compared to Kepler GPUs. Specifics vary by individual models. Maxwell processors are found on GeForce GTX 750xx, some GeForce GTX 8xxM (mobile) models, and GeForce GTX 9xx models. Some GeForce model series contain a mixture of Maxwell and Kepler GPUs, so it is important to check the particular model to be sure it has the desired GPU architecture.

 

Kepler: a previous generation of NVIDIA GPU processor. Contains 2x to 5x more GPU cores than Fermi (the exact core count depends on on the model). Kepler processors are found in GeForce 6xx models, Tesla K10, K20 and K40 models, and Quadro K2000 through K5000. Savant began to provide support for Kepler GPUs in Savant 3.0 and fully supports Kepler since Savant 4.0. Our tests show that Savant GPU performs electromagnetic calculations very well on Kepler GPUs.

 

Fermi: the generation of NVIDIA GPU processor prior to Kepler. Contains up to 512 compute cores and increased memory bandwidth. Savant GPU performs very well on Fermi GPUs. Fermi processors are found in GeForce 4xx and 5xx models, Tesla 20x0 models and Quadro 600, 2000, 4000, 5000 and 6000.

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

Так собственно вопрос, который всех волнует: кому-то удалось "перековать" игровую карту(пусть NVIDIA) таким образом, чтобы эффективно использовать ее в качестве ускорителя расчетов?

Применительно к CST, HFSS(только транзиент вроде?), ADS (там есть галочка...), MWO или Sonnet (они умеют в это вообще?).

Читая http://www.eevblog.com я так и не понял что поменялось после замены ID GTX980 на теслу...

Я еще ни разу не слышал, чтобы софт, способный считать через CUDA не жрал игровые карты nVidia.

 

Еще раз - наличие Tesla, Quadro, или GTX с точки зрения CUDA не имеет никакой разницы. С аппаратной точки зрения есть разница в объеме памяти и в ограничении 64-битных исполнительных унитов на младших версиях карт. Старшие GTX/Quadto/Tesla отличаются частотами(в пользу GTX) и памятью (в пользу Tesla).

 

 

То что CG софт типа 3DS Max выводит не очень хорошую картинку в АППАРАТНЫЙ(!) preview на неперекованных картах, это факт, для этого его и перековывают (причем, на поколениях карт GS перековка не помогала ничем, кроме возможности поставить специализированные дрова без оптимизаций. Квадровые инструкции были выжжены лазером).

Но тут еще штука - для этого эффекта мониторы нужны порядка 1600 строк. На мониторах низкого разрешения, напротив, размазанные антиалаясные линии Quadro выглядят хуже "рваной паутины" выдаваемой на GTX.

Но к CUDA это отношения не имеет! Если я не ошибаюсь, до того как маркетологи приняли туманную расшифровку "Compute Unified Device Architecture", существовала достаточно понятная "Common Unit Data Access".

 

По поводу софта.

CUDA поддерживается в Matlab, но через прокладки, которые сжирают больше 50% теоретического прироста.

 

Существует nVidia cuBLAS библиотека не совместимая с оригинальным BLAS, но реализующая некоторые его функции, для желающих покодить.

 

Поскольку никто кодить не хочет, также была попытка сделать прокладку симулирующую настоящий BLAS и вызывающую cuBlas, либо нормальный Blas по необходимости. Но попытка была реализована только для линуксов, также с серьезными потерями производительности. Есть статья по акселерации в Octave с известной долей корпоративного преувеличения результатов.

https://devblogs.nvidia.com/parallelforall/...ion-gnu-octave/

Под Windows реализации нет, кроме упомянутого нестандартного cuBLAS

Изменено пользователем Hale

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

Я еще ни разу не слышал, чтобы софт, способный считать через CUDA не жрал игровые карты nVidia.

А я вот только и вижу один этот софт...... CST вот хоть. И как его приспособить не под теслу/квад?

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

Можно посмотреть САПР Empire XPU.

Интересный пакет. Впервые слышу спасибо. А есть где-нибудь подробное описание организации вычислительного процесса? Это коммерческая тайна, но всё-таки вдруг где-то написано. Пока непонятно, за счет чего такой выигрыш по сравнению с GPU...

Читаю здесь: http://media.wix.com/ugd/cc9e5f_f1b100a1d1...50966de696a.pdf

 

UPD.:

Получается, что софт сугубо под Intel. То есть они как-то договорились с Intel и получили все сведения о тонкостях работы кэшей, конвейеров и т.д. Я правильно понимаю, что на AMD работать не будет?

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

Да.. Жалко что по делу почти никто так и не высказался. Вместо этих пустых простыней я думал что кто-то напишет об использовании Tesla хотя бы. Какой софт, на сколько быстрее в каких задачах.

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

Получается, что софт сугубо под Intel. То есть они как-то договорились с Intel и получили все сведения о тонкостях работы кэшей, конвейеров и т.д. Я правильно понимаю, что на AMD работать не будет?

Ну так они все используют Intel MKL, которое на все случаи жизни.

C AMD Core Math Library (ACML) видимо все не так однозначно... Кто девушку кормит, то ее и танцует и не надо конспирологии.

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

А я вот только и вижу один этот софт...... CST вот хоть. И как его приспособить не под теслу/квад?

Скорее всего дело не в Тесле, а в том что ваша ишровая карта не обладает необходимыми ресурсами, как то памятью, количеством 64битных блоков, или устаревшая версия Куды. Драйверы тоже надо обновлять, но иногда надо обновлять и ускоритель (это как с переходом с DX10 на DX11)

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

Пока непонятно, за счет чего такой выигрыш по сравнению с GPU...

За счет I/O и случайного доступа к памяти.

У GPU сравнительно ограниченные возможности, заточенные на векторное вычисление. Как только в схеме сбой - для смены задачи приходится прокачивать и преекладывать огромные объемы памяти.

Если программа аккуратно написана СПЦИАЛЬНО для векторных регистров CPU, то она может и на CPU гоняться с переменным успехом за GPU младшего и среднего сегментов. Intel 10 лет вел разработки своего лучевого рендерера для графики под CPU. Хотя проект и провалился, но родил промежуточный тип ускорителей Xeon Phi, которые гораздо более гибкие чем GPU в программировании и I/O.

 

Получается, что софт сугубо под Intel. То есть они как-то договорились с Intel и получили все сведения о тонкостях работы кэшей, конвейеров и т.д. Я правильно понимаю, что на AMD работать не будет?

Никто ни о чем не договаривался. Все задокументированно и предоставлено разработчикам. И нет никакого смысла начинать писать под изначально ущербную платформу. AMD просто отстал и заигрался... при этом у AMD нет такого ресурса как у интела, когда они занимались дурью с NetBurst и Rambus

Изменено пользователем Hale

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

Тогда я не понимаю почему CST пишет именно, что ему надо ТЕСЛА, а не GTX1080?

Что значит не хватает ресурсов? Ну запустись хоть как-то, быстрее будет или нет и зачем такое надо - это второй вопрос уже.

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

Присоединяйтесь к обсуждению

Вы можете написать сейчас и зарегистрироваться позже. Если у вас есть аккаунт, авторизуйтесь, чтобы опубликовать от имени своего аккаунта.

Гость
Ответить в этой теме...

×   Вставлено с форматированием.   Вставить как обычный текст

  Разрешено использовать не более 75 эмодзи.

×   Ваша ссылка была автоматически встроена.   Отображать как обычную ссылку

×   Ваш предыдущий контент был восстановлен.   Очистить редактор

×   Вы не можете вставлять изображения напрямую. Загружайте или вставляйте изображения по ссылке.

×
×
  • Создать...