Умножение и деление в ядрах АРМ

Ответить

AlexeyT 0

1 июля, 2018

Опубликовано 1 июля, 2018 · Жалоба

Всем доброго дня!

Есть вопрос: какие операции с плавающей точкой выполняются быстрее - умножение или деление?

То есть, как эффективней считать нормировку на ядре Arm:

double a;

double b, c, d;//значения присваиваются в ходе выполнения программы

a = sqrt(b*b + c*c + d*d);

b /= a;

c /= a;

d /= a;

Или:

double a;

double b, c, d;//значения присваиваются в ходе выполнения программы

a = 1./sqrt(b*b + c*c + d*d);

b *= a;

c *= a;

d *= a;

Ядрa: Cortex-M1 и Cortex-M4F (что не особо важно, т.к. расчеты должны быть в формате double и плавающая запятая в Cortex-M4F не поможет)

Спасибо

Цитата

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

aaarrr 69

1 июля, 2018

Опубликовано 1 июля, 2018 · Жалоба

Умножение быстрее. Но на фоне sqrt() вряд ли заметите разницу.

Цитата

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

AlexeyT 0

1 июля, 2018

Опубликовано 1 июля, 2018 · Жалоба

Умножение быстрее. Но на фоне sqrt() вряд ли заметите разницу.

Ну у Уоррена есть примеры сверхбыстрого вычисления sqrt для float.

А на сколько быстрее? Сам пока оценить не могу, нет ни компилятора, чтобы ассемблерный листинг посмотреть, ни само собой отладочной платы. Может кто-нибудь дать оценку?

Цитата

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

aaarrr 69

1 июля, 2018

Опубликовано 1 июля, 2018 · Жалоба

А на сколько быстрее?

В разы быстрее.

Цитата

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

Den64 0

1 июля, 2018

Опубликовано 1 июля, 2018 · Жалоба

Попробуйте в симуляторе проверить или в железе. Должно быть примерно одинаково, но как правило деление медленнее.

Цитата

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

Forger 26

2 июля, 2018

Опубликовано 2 июля, 2018 · Жалоба

нет ни компилятора

Компилятор вместе со средой можно скачать бесплатно, для маленького кода можно использовать также бесплатно:

https://www.keil.com/download/product/

https://www.iar.com/iar-embedded-workbench/

Есть и другие среды, целиком бесплатные (на базе компилятора GCC).

Внутри любой нормальной среды есть симулятор, тогда отладочная плата для данной ситуации не обязательна.

Цитата

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

BioWolf2000 3

5 июля, 2018

Опубликовано 5 июля, 2018 · Жалоба

Компилятор вместе со средой можно скачать бесплатно, для маленького кода можно использовать также бесплатно:
https://www.keil.com/download/product/

https://www.iar.com/iar-embedded-workbench/

Есть и другие среды, целиком бесплатные (на базе компилятора GCC).

Внутри любой нормальной среды есть симулятор, тогда отладочная плата для данной ситуации не обязательна.

С осциллографом измерения уже делали )

https://blog.classycode.com/esp32-floating-...ce-6e9f6f567a69

В микросекундах

Ядрa: Cortex-M1 и Cortex-M4F (что не особо важно, т.к. расчеты должны быть в формате double и плавающая запятая в Cortex-M4F не поможет)

Спасибо

Можно попробовать использовать ядро Cortex-M7 с double precission FPU

Цитата

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

Arlleex 187

5 июля, 2018

Опубликовано 5 июля, 2018 · Жалоба

Интересно откуда такая разница в вычислениях корня float и double с аппаратным double-precision FPU...

Цитата

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

jcxz 241

5 июля, 2018

Опубликовано 5 июля, 2018 · Жалоба

Интересно откуда такая разница в вычислениях корня float и double с аппаратным double-precision FPU...

Ну как откуда? Некий автор в очередной раз успешно измерил скорость работы GPIO :laughing:

Цитата

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

Arlleex 187

5 июля, 2018

Опубликовано 5 июля, 2018 (изменено) · Жалоба

Ну как откуда? Некий автор в очередной раз успешно измерил скорость работы GPIO :laughing:

Надеюсь все-таки что измерения не верны... Не шибко верю что скорость аппаратных модулей FPU и DPFPU вообще различна (хотя раза в 2 я еще поверю, из-за двойного чтения слов для double вместо одного для float, но и то это мои догадки)... :crying:

Изменено 5 июля, 2018 пользователем Arlleex

Цитата

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

jcxz 241

5 июля, 2018

Опубликовано 5 июля, 2018 · Жалоба

Надеюсь все-таки что измерения не верны...

То что там написано, вообще можно воспринимать как написанное на заборе. Обратите хотя-бы внимание на длительность сложения float и doublle. Не находите странным что float получилось медленнее? :biggrin:

При этом никакие попытки измерить скорость GPIO (и учесть её влияние) не произведены. Не произведены также попытки учесть влияние кешей и пр.

В мусорку такие "результаты".

Цитата

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

scifi 1

5 июля, 2018

Опубликовано 5 июля, 2018 · Жалоба

Интересно откуда такая разница в вычислениях корня float и double с аппаратным double-precision FPU...

Вангую кривую библиотеку. Аффтар даже не пишет, чем собирает. У того же GNU Arm Embedded иногда бывают чудеса в библиотеке (newlib).

Цитата

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

Arlleex 187

5 июля, 2018

Опубликовано 5 июля, 2018 · Жалоба

В общем в очередной раз "не железо виновато..."(с) :rolleyes:

Цитата

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

GenaSPB 11

5 июля, 2018

Опубликовано 5 июля, 2018 (изменено) · Жалоба

Неделю назад выложили (arm.com) очередную версию arm-none-eabi-gcc с поправленной библиотекой в части тормозовы вычисления функций с одинарной точностью на процессорах без DP FPU.

◦Fixed powf/expf/exp2f/logf/log2f performance regression

Изменено 5 июля, 2018 пользователем Genadi Zawidowski

Цитата

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

AVI-crak 0

5 июля, 2018

Опубликовано 5 июля, 2018 · Жалоба

Неделю назад выложили (arm.com) очередную версию arm-none-eabi-gcc с поправленной библиотекой в части тормозовы вычисления функций с одинарной точностью на процессорах без DP FPU.

Какое странное совпадение, неделю назад я выловил последний баг в собственной библиотеке стандартных математических функций для одинарной точности. Но у меня была задача сделать минимальную ошибку вычислений. Значит зря старался?

Кстати - дай плиз ссылку для особоленивых... А то у них там обе ноги сломать можно, пока найдёшь то что нужно.

И ещё.

Вычисление квадратного корня на arm чипе с аппаратной поддержкой 14тиков для одинарной точности, и кажется 36тиков для двойной(не уверен в точности). Это аппаратные инструкции для Cortex-M4-7, которых естественно нету в Cortex-Axx - потому как это отдельная ветка развития ядра, и у них вроде как война.

Цитата

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

Присоединяйтесь к обсуждению

Вы можете написать сейчас и зарегистрироваться позже. Если у вас есть аккаунт, авторизуйтесь, чтобы опубликовать от имени своего аккаунта.

К сожалению, ваш контент содержит запрещённые слова. Пожалуйста, отредактируйте контент, чтобы удалить выделенные ниже слова.

Ответить в этой теме...

× Вставлено с форматированием. Вставить как обычный текст

Разрешено использовать не более 75 эмодзи.

× Ваша ссылка была автоматически встроена. Отображать как обычную ссылку

× Ваш предыдущий контент был восстановлен. Очистить редактор

× Вы не можете вставлять изображения напрямую. Загружайте или вставляйте изображения по ссылке.

Указать URL изображения

Подписчики 0

AlexeyT 0

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

aaarrr 69

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

AlexeyT 0

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

aaarrr 69

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

Den64 0

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

Forger 26

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

BioWolf2000 3

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

Arlleex 187

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

jcxz 241

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

Arlleex 187

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

jcxz 241

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

scifi 1

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

Arlleex 187

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

GenaSPB 11

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

AVI-crak 0

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

Присоединяйтесь к обсуждению

Обзор

Активность