Перейти к содержанию
    

Производительность SSE2NEON

Кто-нибудь использовал в своих проектах данную реализацию замены SSE на NEON?

https://github.com/DLTcollab/sse2neon

Понятно, что переписывание наиболее вычислительно затратных вещей под целевую платформу даст наибольший выигрыш, но хочется сохранить единую кодовую базу с x86_64, где уже используются интринсики.

Если кто-то профилировал данную или подобные реализации, то сильно ли она проигрывала написанному коду непосредственно под NEON?

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

Да проигрывает, на нативных ARM Simd будет в разы быстрее. Но советую пользоваться тк альтернативы собственно нету

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

8 часов назад, SimpleSoft сказал:

Да проигрывает, на нативных ARM Simd будет в разы быстрее. Но советую пользоваться тк альтернативы собственно нету

Спасибо! Почти в 4 раза ускорился по сравнению с сишным кодом. Получается, что еще можно в несколько раз улучшить?

P.S. В принципе текущее время пока что устраивает.

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

Присоединяйтесь к обсуждению

Вы можете написать сейчас и зарегистрироваться позже. Если у вас есть аккаунт, авторизуйтесь, чтобы опубликовать от имени своего аккаунта.

Гость
К сожалению, ваш контент содержит запрещённые слова. Пожалуйста, отредактируйте контент, чтобы удалить выделенные ниже слова.
Ответить в этой теме...

×   Вставлено с форматированием.   Вставить как обычный текст

  Разрешено использовать не более 75 эмодзи.

×   Ваша ссылка была автоматически встроена.   Отображать как обычную ссылку

×   Ваш предыдущий контент был восстановлен.   Очистить редактор

×   Вы не можете вставлять изображения напрямую. Загружайте или вставляйте изображения по ссылке.

×
×
  • Создать...