Evgen_ps 0 2 июля, 2015 Опубликовано 2 июля, 2015 · Жалоба Доброго времени суток! Пишу для Blackfin 504f программу в Visualdsp++. Необходимо, как обычно, максимально ускорить выполнение операций (для обработки сигнала в реальном времени). Есть у меня цикл for, где выполняются 2 команды, каждая из которых загружает только 1 АЛУ. В дизасемблере они выполняются по очереди. И по количеству тактов можно судить, что так и есть. Однако хотелось бы заставить выполняться их параллельно - благо, теоретически это возможно, возможности ядра позволяют. Когда-то давно читал о неком "заклинании" (то ли это #pragma..., то ли #define..., то ли еще что-то), которое заставляет цикл for работать быстрее именно по принципу выполнения параллельных операций. Но сейчас этого не помню, а найти не могу :( Может, посоветуете что-нибудь (кроме того, чтобы написать все на ассемблере с символом "||"). Цитата Поделиться сообщением Ссылка на сообщение Поделиться на другие сайты Поделиться
V_G 8 2 июля, 2015 Опубликовано 2 июля, 2015 · Жалоба Не знаю, позволяют ли АЛУ вашего проца выполнять параллельно разные инструкции. Часто в многопроцессорных системах и в DSP используют концепцию SIMD (single instruction, multiple data), т.е. все процессоры параллельно выполняют одни и те же инструкции, но каждый - со своими данными. Если ваши 2 АЛУ придерживаются той же идеологии, то в общем случае поставленную задачу не решить. Цитата Поделиться сообщением Ссылка на сообщение Поделиться на другие сайты Поделиться
thermit 1 2 июля, 2015 Опубликовано 2 июля, 2015 · Жалоба Доброго времени суток! Пишу для Blackfin 504f программу в Visualdsp++. Необходимо, как обычно, максимально ускорить выполнение операций (для обработки сигнала в реальном времени). Есть у меня цикл for, где выполняются 2 команды, каждая из которых загружает только 1 АЛУ. В дизасемблере они выполняются по очереди. И по количеству тактов можно судить, что так и есть. Однако хотелось бы заставить выполняться их параллельно - благо, теоретически это возможно, возможности ядра позволяют. Когда-то давно читал о неком "заклинании" (то ли это #pragma..., то ли #define..., то ли еще что-то), которое заставляет цикл for работать быстрее именно по принципу выполнения параллельных операций. Но сейчас этого не помню, а найти не могу :( Может, посоветуете что-нибудь (кроме того, чтобы написать все на ассемблере с символом "||"). http://www.analog.com/media/en/technical-d...otes/EE-149.pdf Цитата Поделиться сообщением Ссылка на сообщение Поделиться на другие сайты Поделиться