Перейти к содержанию
    

Как рассчитать Флопсы?

Привет.

Собственно вопрос возник из того, что мы обнаружили, что наш код, сгенерированный из моделей в Matlab, нуждается только в гигагерцах и плавающей запятой. То есть скорость выполнения одного шага практически линейно зависит от частоты ядра, а скорость работы с памятью и периферией практически не влияет.

Сама прога не распараллеливается - то есть нужно просто производительное ядро.

 

Мы хотим понять, какой из представленных на рынке ширпотребных процессоров (ориентируемся на Intel Core) нам подходит больше. Как правило, это самый быстрый, но мне кажется, что не факт.

Я так понимаю, что производительность ядер процессоров меряется в GFlopsах. Но тот же интел перестал публиковать производительность своих процессоров с 2011 года, а Benchmarkи гоняют непонятно какие тесты разных версий, что невозможно сравнить процессоры разных лет выпуска или генераций.

Так вот возможно ли как-то рассчитать производительность в GFlops для конкретного процессора по даташиту? Или только тестировать?

 

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

поскольку intel core - это суп, сваренный из multi-core, out-of-order, и 4-way superscalar, то вычислять по даташиту - это гадать на кофейной гуще.

 

вам надо выбрать синтетический тест, который будет наиболее похож на вашу задачу.

для этого важно знать влезает ли ваш код полностью в кэш-память или нет, и если не влезает - то насколько.

 

Если объем данных сопоставим с полным размером оперативки - то в качестве теста реомендую linpack (можно взять LinX если у вас Windows). Собственно именно им гигафлопсы связки материнка-проц-память и определяются. Собственно, linpack-ом даже TOP500 оценивают.

Если объём данных до 50 мегабайт - есть Xeon-ы с 45 Мбайт кеш-памяти, можно подумать в эту сторону.

Если и того меньше - то смотреть только на частоту.

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

Данных у меня от силы 1 мегабайт. Это то, что надо прочитать из памяти, обработать и записать обратно. Сам шаг выполняется примерно за 80мкс на одном ядре процессора Core i7 второй генерации с тактовой частотой 2,2ГГц.

Проблема в том, что у меня цикл реалтайм в 100мкс, и поэтому загрузка процессора уже 80%, что приводит к мысле, что усложнить модель уже не получится, а оптимизации включать не хочется.

 

 

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

если сейчас у вас процесс один - может попробовать разбить задачу на последовательные куски, и попытаться состыковать процессы друг с другом сокетами.

может тогда удастся задействовать >1 ядра?

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

поскольку intel core - это суп, сваренный из multi-core, out-of-order, и 4-way superscalar...

 

А если распараллеливать вычисления с плавающей точкой, сколько в современных i3, i5, i7, Xeon есть FPU?

 

 

Я так понимаю, что производительность ядер процессоров меряется в GFlopsах. Но тот же интел перестал публиковать производительность своих процессоров с 2011 года, а Benchmarkи гоняют непонятно какие тесты разных версий, что невозможно сравнить процессоры разных лет выпуска или генераций.

 

А Intel Microprocessor Export Compliance Metrics с обновлениями 21-Nov-2015 вас не устраивают?

 

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

А Intel Microprocessor Export Compliance Metrics с обновлениями 21-Nov-2015 вас не устраивают?

Если кликнуть на любой серии, то скромно говорится о ноябре 2011. Также новые серии там отсутствуют вообще.

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

С другой стороны - позавчера послал запрос по мылу на [email protected] на i5-4400E - сегодня бодренько ответили с GFlopsами и прочей инфой. Так, что похоже проблема решена.

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

Присоединяйтесь к обсуждению

Вы можете написать сейчас и зарегистрироваться позже. Если у вас есть аккаунт, авторизуйтесь, чтобы опубликовать от имени своего аккаунта.

Гость
Ответить в этой теме...

×   Вставлено с форматированием.   Вставить как обычный текст

  Разрешено использовать не более 75 эмодзи.

×   Ваша ссылка была автоматически встроена.   Отображать как обычную ссылку

×   Ваш предыдущий контент был восстановлен.   Очистить редактор

×   Вы не можете вставлять изображения напрямую. Загружайте или вставляйте изображения по ссылке.

×
×
  • Создать...