syoma 1 27 января, 2016 Опубликовано 27 января, 2016 · Жалоба Привет. Собственно вопрос возник из того, что мы обнаружили, что наш код, сгенерированный из моделей в Matlab, нуждается только в гигагерцах и плавающей запятой. То есть скорость выполнения одного шага практически линейно зависит от частоты ядра, а скорость работы с памятью и периферией практически не влияет. Сама прога не распараллеливается - то есть нужно просто производительное ядро. Мы хотим понять, какой из представленных на рынке ширпотребных процессоров (ориентируемся на Intel Core) нам подходит больше. Как правило, это самый быстрый, но мне кажется, что не факт. Я так понимаю, что производительность ядер процессоров меряется в GFlopsах. Но тот же интел перестал публиковать производительность своих процессоров с 2011 года, а Benchmarkи гоняют непонятно какие тесты разных версий, что невозможно сравнить процессоры разных лет выпуска или генераций. Так вот возможно ли как-то рассчитать производительность в GFlops для конкретного процессора по даташиту? Или только тестировать? Цитата Поделиться сообщением Ссылка на сообщение Поделиться на другие сайты Поделиться
krux 8 27 января, 2016 Опубликовано 27 января, 2016 · Жалоба поскольку intel core - это суп, сваренный из multi-core, out-of-order, и 4-way superscalar, то вычислять по даташиту - это гадать на кофейной гуще. вам надо выбрать синтетический тест, который будет наиболее похож на вашу задачу. для этого важно знать влезает ли ваш код полностью в кэш-память или нет, и если не влезает - то насколько. Если объем данных сопоставим с полным размером оперативки - то в качестве теста реомендую linpack (можно взять LinX если у вас Windows). Собственно именно им гигафлопсы связки материнка-проц-память и определяются. Собственно, linpack-ом даже TOP500 оценивают. Если объём данных до 50 мегабайт - есть Xeon-ы с 45 Мбайт кеш-памяти, можно подумать в эту сторону. Если и того меньше - то смотреть только на частоту. Цитата Поделиться сообщением Ссылка на сообщение Поделиться на другие сайты Поделиться
syoma 1 27 января, 2016 Опубликовано 27 января, 2016 · Жалоба Данных у меня от силы 1 мегабайт. Это то, что надо прочитать из памяти, обработать и записать обратно. Сам шаг выполняется примерно за 80мкс на одном ядре процессора Core i7 второй генерации с тактовой частотой 2,2ГГц. Проблема в том, что у меня цикл реалтайм в 100мкс, и поэтому загрузка процессора уже 80%, что приводит к мысле, что усложнить модель уже не получится, а оптимизации включать не хочется. Цитата Поделиться сообщением Ссылка на сообщение Поделиться на другие сайты Поделиться
krux 8 27 января, 2016 Опубликовано 27 января, 2016 · Жалоба если сейчас у вас процесс один - может попробовать разбить задачу на последовательные куски, и попытаться состыковать процессы друг с другом сокетами. может тогда удастся задействовать >1 ядра? Цитата Поделиться сообщением Ссылка на сообщение Поделиться на другие сайты Поделиться
_4afc_ 24 27 января, 2016 Опубликовано 27 января, 2016 · Жалоба поскольку intel core - это суп, сваренный из multi-core, out-of-order, и 4-way superscalar... А если распараллеливать вычисления с плавающей точкой, сколько в современных i3, i5, i7, Xeon есть FPU? Я так понимаю, что производительность ядер процессоров меряется в GFlopsах. Но тот же интел перестал публиковать производительность своих процессоров с 2011 года, а Benchmarkи гоняют непонятно какие тесты разных версий, что невозможно сравнить процессоры разных лет выпуска или генераций. А Intel Microprocessor Export Compliance Metrics с обновлениями 21-Nov-2015 вас не устраивают? Цитата Поделиться сообщением Ссылка на сообщение Поделиться на другие сайты Поделиться
syoma 1 27 января, 2016 Опубликовано 27 января, 2016 · Жалоба А Intel Microprocessor Export Compliance Metrics с обновлениями 21-Nov-2015 вас не устраивают? Если кликнуть на любой серии, то скромно говорится о ноябре 2011. Также новые серии там отсутствуют вообще. Цитата Поделиться сообщением Ссылка на сообщение Поделиться на другие сайты Поделиться
syoma 1 28 января, 2016 Опубликовано 28 января, 2016 · Жалоба С другой стороны - позавчера послал запрос по мылу на [email protected] на i5-4400E - сегодня бодренько ответили с GFlopsами и прочей инфой. Так, что похоже проблема решена. Цитата Поделиться сообщением Ссылка на сообщение Поделиться на другие сайты Поделиться