jcxz 184 25 января, 2021 Опубликовано 25 января, 2021 · Жалоба 20 минут назад, sasamy сказал: CMSIS ? Что "CMSIS"? Цитата Поделиться сообщением Ссылка на сообщение Поделиться на другие сайты Поделиться
AlexandrY 2 25 января, 2021 Опубликовано 25 января, 2021 · Жалоба 22 minutes ago, sasamy said: CMSIS ? https://arm-software.github.io/CMSIS_5/DSP/html/group__Max.html Не, лучше пусть memcpy перепишет на ассемблере. Вот потеха будет. Цитата Поделиться сообщением Ссылка на сообщение Поделиться на другие сайты Поделиться
sasamy 11 25 января, 2021 Опубликовано 25 января, 2021 (изменено) · Жалоба 57 minutes ago, jcxz said: Что "CMSIS"? Библиотека оптимизированных под SIMD ф-ий Quote DSP library collection with over 60 Functions for various data types: fixed-point (fractional q7, q15, q31) and single precision floating-point (32-bit). Implementations optimized for the SIMD instruction set are available for Cortex-M4/M7/M33/M35P. на C Изменено 25 января, 2021 пользователем sasamy Цитата Поделиться сообщением Ссылка на сообщение Поделиться на другие сайты Поделиться
jcxz 184 25 января, 2021 Опубликовано 25 января, 2021 · Жалоба 52 минуты назад, sasamy сказал: на C Приведите листинг компиляции. Цитата Поделиться сообщением Ссылка на сообщение Поделиться на другие сайты Поделиться
mantech 33 25 января, 2021 Опубликовано 25 января, 2021 (изменено) · Жалоба 8 часов назад, AlexandrY сказал: Не, лучше пусть memcpy перепишет на ассемблере. А чего тешитесь - memcpy гораздо быстрее работает на НЕОНе, и да, на ассемблере, так что тут шуточки в сторону... 7 часов назад, sasamy сказал: Библиотека оптимизированных под SIMD ф-ий Так лень все перекапывать, но подобные функции vdupq_n_s16 скорее всего на асме писаны... 24.01.2021 в 03:00, SII сказал: Разработкой ОС, написанием драйверов и т.п. низкоуровневой фигнёй занимается тоже меньше 1% программистов, а основная масса тусуется в веб-разработке. Ну тут уж мягкое с теплым не путайте, скорее всего все те, кто тут отписался все-таки больше занимаются как раз низкоуровневой разработкой, да платят вебщикам больше, но тут меньше быдлокода и интереснее Изменено 25 января, 2021 пользователем mantech Цитата Поделиться сообщением Ссылка на сообщение Поделиться на другие сайты Поделиться
jcxz 184 26 января, 2021 Опубликовано 26 января, 2021 · Жалоба 13 часов назад, mantech сказал: А чего тешитесь - memcpy гораздо быстрее работает на НЕОНе, и да, на ассемблере, так что тут шуточки в сторону... Она (библиотечная) и на Cortex-M написана на асме (в IAR по крайней мере). Если кто-то этого не знает - сразу видно, что он ни разу не запускал отладчик. И вправда - на кой рекламщику отладчик? Цитата Поделиться сообщением Ссылка на сообщение Поделиться на другие сайты Поделиться
jeka 0 8 апреля, 2021 Опубликовано 8 апреля, 2021 · Жалоба Еще немного про кеш (тестировалось на DRAM памяти, кеш включен на чтение и запись) Заметил, что при любом обращении на чтение незакешированных данных, читается _вся_ строка кеша (32 байта), а не только тот элемент что вы запросили. Т.е. достаточно одной операции (например PLD) чтоб предварительно загрузить всю строку кеша. Предположительно, при чтении на границе будут читаться 2 строки кеша (будет полезно чтоб командой PLD грузить сразу 64 байта) Цитата Поделиться сообщением Ссылка на сообщение Поделиться на другие сайты Поделиться
jcxz 184 8 апреля, 2021 Опубликовано 8 апреля, 2021 · Жалоба 2 часа назад, jeka сказал: Заметил, что при любом обращении на чтение незакешированных данных, читается _вся_ строка кеша (32 байта), а не только тот элемент что вы запросили. Т.е. достаточно одной операции (например PLD) чтоб предварительно загрузить всю строку кеша. Возможно - дело не в кеше, а размере пакета для DRAM-интерфейса. DRAM позволяет производить пакетный обмен с памятью и размер пакета задаётся при инициализации в широких пределах. Возможно задан размер пакета == 32 байта. Цитата Поделиться сообщением Ссылка на сообщение Поделиться на другие сайты Поделиться
dxp 32 9 апреля, 2021 Опубликовано 9 апреля, 2021 · Жалоба При работе "кэш-память" всегда читается-пишется вся линия кэша. Размер линии у всех разный, но часто это 32 байта. Делать короче смысла мало — накладные обращения в DRAM большие. Цитата Поделиться сообщением Ссылка на сообщение Поделиться на другие сайты Поделиться