Grizzly 0 6 марта, 2021 Опубликовано 6 марта, 2021 · Жалоба Кто-нибудь использовал в своих проектах данную реализацию замены SSE на NEON? https://github.com/DLTcollab/sse2neon Понятно, что переписывание наиболее вычислительно затратных вещей под целевую платформу даст наибольший выигрыш, но хочется сохранить единую кодовую базу с x86_64, где уже используются интринсики. Если кто-то профилировал данную или подобные реализации, то сильно ли она проигрывала написанному коду непосредственно под NEON? Цитата Поделиться сообщением Ссылка на сообщение Поделиться на другие сайты Поделиться
SimpleSoft 0 9 марта, 2021 Опубликовано 9 марта, 2021 · Жалоба Да проигрывает, на нативных ARM Simd будет в разы быстрее. Но советую пользоваться тк альтернативы собственно нету Цитата Поделиться сообщением Ссылка на сообщение Поделиться на другие сайты Поделиться
Grizzly 0 9 марта, 2021 Опубликовано 9 марта, 2021 · Жалоба 8 часов назад, SimpleSoft сказал: Да проигрывает, на нативных ARM Simd будет в разы быстрее. Но советую пользоваться тк альтернативы собственно нету Спасибо! Почти в 4 раза ускорился по сравнению с сишным кодом. Получается, что еще можно в несколько раз улучшить? P.S. В принципе текущее время пока что устраивает. Цитата Поделиться сообщением Ссылка на сообщение Поделиться на другие сайты Поделиться