GCC ARM - не имплементируются функции SIN, COS - GNU/OpenSource средства разработки

repstosw 18

1 октября, 2017

Опубликовано 1 октября, 2017 · Жалоба

Здравствуйте.

Скачал и поставил, затем ребутнул (для переменных окружения) GCC-тулчейн: gcc-arm-none-eabi-6-2017-q2-update-win32.exe

Затем написал программу тект ниже:

#include <math.h>

float a=1.2F;
float b=3.21F;
float c=0.0F;

void main(void)
{
c=sin(a+b);
b=cos(a+c);
}

Построил бинарник и все необходимые файлы командами:

arm-none-eabi-gcc -std=c99 -march=armv7-a -mfloat-abi=hard -mfpu=vfpv4 -c fpu.c -o fpu.elf -lm
arm-none-eabi-objdump -D fpu.elf > fpu.asm
arm-none-eabi-objcopy -O binary fpu.elf fpu.bin

При просмотре листинга видно, что функции sin( ) и cos( ) НЕ ИМПЛЕМЕНТИРОВАЛИСЬ, вместо них стоит переход:

18:    e3403000     movt    r3, #0
  1c:    edd37a00     vldr    s15, [r3]
  20:    ee777a27     vadd.f32    s15, s14, s15
  24:    eef70ae7     vcvt.f64.f32    d16, s15
  28:    eeb00b60     vmov.f64    d0, d16
  2c:    ebfffffe     bl    0 <sin> ----------------------------- !!! нет вызова
  30:    eef00b40     vmov.f64    d16, d0
  34:    eef77be0     vcvt.f32.f64    s15, d16
  38:    e3003000     movw    r3, #0
  3c:    e3403000     movt    r3, #0
  40:    edc37a00     vstr    s15, [r3]
  44:    e3003000     movw    r3, #0
  48:    e3403000     movt    r3, #0
  4c:    ed937a00     vldr    s14, [r3]
  50:    e3003000     movw    r3, #0
  54:    e3403000     movt    r3, #0
  58:    edd37a00     vldr    s15, [r3]
  5c:    ee777a27     vadd.f32    s15, s14, s15
  60:    eef70ae7     vcvt.f64.f32    d16, s15
  64:    eeb00b60     vmov.f64    d0, d16
  68:    ebfffffe     bl    0 <cos> ----------------------------- !!! нет вызова

Других тулчейнов нет, пробовал soft-fpu, ничего не меняется, функции из math.h не имплементируются вообще!

Залез в папки тулчейна, так там libm.a несколько штук:

...\GCCARM\arm-none-eabi\lib\libm.a

...\GCCARM\arm-none-eabi\lib\thumb\libm.a

...\GCCARM\arm-none-eabi\lib\thumb\v7-ar\libm.a

...\GCCARM\arm-none-eabi\lib\thumb\v7-ar\fpv3\hard\libm.a

...\GCCARM\arm-none-eabi\lib\hard\libm.a

У меня нет слов, одни эмоции (касаемо GCC тулчейна)!

Помогите плиз, нужен хардварный синус/косинус для ядра Cortex-A7, VFPv4 или NEON - для floating point, как решить проблему?

Цитата

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

scifi 1

1 октября, 2017

Опубликовано 1 октября, 2017 · Жалоба

Скачал и поставил, затем ребутнул (для переменных окружения) GCC-тулчейн: gcc-arm-none-eabi-6-2017-q2-update-win32.exe
...

Помогите плиз, нужен хардварный синус/косинус для ядра Cortex-A7, VFPv4 или NEON - для floating point, как решить проблему?

Во-первых, не то скачали. Там английским по белому написано "Arm Cortex-M and Cortex-R". То есть дальше его ковырять нет смысла. Ищите правильный gcc.

Попробуйте вот это.

Цитата

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

repstosw 18

1 октября, 2017

Опубликовано 1 октября, 2017 · Жалоба

Попробуйте вот это.

Там 4 тулчейна и все оканчиваются на eabi, тоесть привязано к операционной системе. Мне надо под железо писать, какой из этих тулчейнов сойдёт?

Разработка в Win32, целевая платформа Cortex-A7.

gcc-linaro-6.3.1-2017.05-i686-mingw32_arm-eabi.tar.xz 23-May-2017 08:39 388.7M open

gcc-linaro-6.3.1-2017.05-i686_arm-eabi.tar.xz 23-May-2017 08:39 263.8M open

gcc-linaro-6.3.1-2017.05-x86_64_arm-eabi.tar.xz 23-May-2017 08:39 248.1M open

sysroot-newlib-linaro-2017.05-arm-eabi.tar.xz 23-May-2017 08:39 44.2M open

Цитата

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

scifi 1

1 октября, 2017

Опубликовано 1 октября, 2017 · Жалоба

Вот здесь разъясняют. Видимо, вам надо arm-eabihf, но такого там нет. Пичалька :crying:

Вероятно, придётся собирать тулчейн самостоятельно.

Цитата

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

repstosw 18

1 октября, 2017

Опубликовано 1 октября, 2017 · Жалоба

тот тулчейн что я скачал в ридмишнике написано :

|----------|--------------------------------------------|----------|
|Cortex-A* | [-mthumb] -march=armv7-a | armv7-ar |

|(No FP) | | /thumb |

|----------|--------------------------------------------|----------|

|Cortex-A* | [-mthumb] -march=armv7-a -mfloat-abi=softfp| armv7-ar |

|(Soft FP) | -mfpu=vfpv3-d16 | /thumb |

| | | /softfp |

|----------|--------------------------------------------|----------|

|Cortex-A* | [-mthumb] -march=armv7-a -mfloat-abi=hard | armv7-ar |

|(Hard FP) | -mfpu=vfpv3-d16 | /thumb |

| | | /fpu |

--------------------------------------------------------------------

Я правильно думаю, что -march=armv7-a - это Cortex-A7 ?

Цитата

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

scifi 1

1 октября, 2017

Опубликовано 1 октября, 2017 · Жалоба

Я правильно думаю, что -march=armv7-a - это Cortex-A7 ?

Здесь написано.

Цитата

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

scifi 1

1 октября, 2017

Опубликовано 1 октября, 2017 · Жалоба

Куда дальше рыть?

Вероятно, придётся собирать тулчейн самостоятельно.

Тот же линаро вроде бы публикует скрипты для сборки. Ещё рассказывают про buildroot и всё такое.

Есть ещё Sysprogs, но я не знаю, есть ли там hardfloat.

Цитата

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

aaarrr 63

1 октября, 2017

Опубликовано 1 октября, 2017 · Жалоба

Hard FPU тут даже и не пахнет:

Шок-абзац, ага. А команды вида vXXX.f32 - это что, как думаете?

Цитата

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

repstosw 18

1 октября, 2017

Опубликовано 1 октября, 2017 · Жалоба

Тут пишут https://habrahabr.ru/post/319736/ , что:

*eabihf — это почти то же самое, что и eabi, с разницей в реализации ABI вызова функций с плавающей точкой. hf — расшифровывается как hard float

Так может разница лишь в реализации вызова функций с FP?

Есть ли ещё какие-нибудь компиляторы для Cortex-A7, кроме вышеупомянутых?

И вообще GNU - дрянь ещё та... Писал во многих средах: Keil ARM MDK, IAR, Visual DSP, Visual C,.... - нигде такого гемора как с GNU нет

Цитата

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

scifi 1

1 октября, 2017

Опубликовано 1 октября, 2017 · Жалоба

Помогите плиз, нужен хардварный синус/косинус для ядра Cortex-A7, VFPv4 или NEON - для floating point, как решить проблему?

Что такое "хардварный синус/косинус"? Вычисление одной инструкцией? Такое вообще существует в природе?

И вообще GNU - дрянь ещё та... Писал во многих средах: Keil ARM MDK, IAR, Visual DSP, Visual C,.... - нигде такого гемора как с GNU нет

Мыши плакали, кололись, но продолжали жрать кактус. Ну и используйте всё вышеупомянутое, кто же мешает?

Цитата

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

repstosw 18

1 октября, 2017

Опубликовано 1 октября, 2017 · Жалоба

Шок-абзац, ага. А команды вида vXXX.f32 - это что, как думаете?

Это то что мне надо, и я это видел. Вопрос ни к ним, а к реализации синуса/косинуса. Почему так фигово реализовано? Я подозреваю, что из-за неправильных ключей компилятора/линковщика и отсутствия явно заданных путей. Одних только libm.a - куча и какая из них используется???

И с адреса 0x8000 программа пошла, хотя для линковщика ниче не указано, и _exit() понадобился... Одно г_вно честное слово...

Что такое "хардварный синус/косинус"? Вычисление одной инструкцией? Такое вообще существует в природе?

Существует: начиная ещё с древних со-процессоров x87 intel: fsin,fcos.

Мыши плакали, кололись, но продолжали жрать кактус. Ну и используйте всё вышеупомянутое, кто же мешает?

Мешает отсутствие альтернативы. С удовольствием писал бы в Keil ARM MDK, но там нет Coretex-A7 без привязки к контроллеру.

Цитата

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

scifi 1

1 октября, 2017

Опубликовано 1 октября, 2017 · Жалоба

Существует: начиная ещё с древних со-процессоров x87 intel: fsin,fcos.

Хорошо, уточняю: у Cortex-A7 есть такие инструкции?

Update:

Похоже, аффтар слился. Обкакал GNU, а оказалось, что это его собственное недомыслие. Бывает, чо.

Цитата

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

repstosw 18

1 октября, 2017

Опубликовано 1 октября, 2017 · Жалоба

Хорошо, уточняю: у Cortex-A7 есть такие инструкции?

Подозреваю, что нет. Но я не дурак и вижу, что sin() и cos() по своему объёму не внушают быстродействия. А значит, не все ключи оптимизации задействованы или нужно другую либу math подключить. Вот я и хочу выяснить, есть ли более лучший вариант реализации или мне пасти нечего?

В ряд Тейлора и то быстрее было бы.

Ещё раз прогнал код, на этот раз проверил ещё умножение и корень - эти работают как надо:

#include <fastmath.h>

float a=1.2F;
float b=3.21F;
float c=0.0F;

void main(void)
{
c=a+b;
a=b*c;
b=sinf(a);
c=sqrtf(b);
}

void _exit(int i)
{
while(1);
}


00008030 <main>:
    8030:    b538          push    {r3, r4, r5, lr}
    8032:    f249 642c     movw    r4, #38444; 0x962c
    8036:    f2c0 0401     movt    r4, #1
    803a:    f649 2588     movw    r5, #39560; 0x9a88
    803e:    f2c0 0501     movt    r5, #1
    8042:    ed2d 8b02     vpush    {d8}
    8046:    edd4 7a00     vldr    s15, [r4]
    804a:    ed94 7a01     vldr    s14, [r4, #4]
    804e:    ee37 7a87     vadd.f32    s14, s15, s14         ------------OK
    8052:    ee67 7a87     vmul.f32    s15, s15, s14        ------------OK
    8056:    ed85 7a00     vstr    s14, [r5]
    805a:    eeb0 0a67     vmov.f32    s0, s15
    805e:    edc4 7a01     vstr    s15, [r4, #4] 
    8062:    f000 f89d     bl    81a0 <sinf>         ---------- VERY BAD !!!
    8066:    eeb5 0a40     vcmp.f32    s0, #0.0
    806a:    ed84 0a00     vstr    s0, [r4]
    806e:    eeb1 8ac0     vsqrt.f32    s16, s0     ------------OK

Напрягает наличие процедуры _exit() и программа слинковалась для адреса 0x8000.

Можно ли как-то избавиться от _exit() и слинковать для адреса 0, не прибегая к линкерным скриптам? (я это могу сделать, только не даёт покоя вопрос, почему в первом случае слинковалось без мусора с с 0? (см. первый пост))

Цитата

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

scifi 1

1 октября, 2017

Опубликовано 1 октября, 2017 · Жалоба

Подозреваю, что нет. Но я не дурак и вижу, что sin() и cos() по своему объёму не внушают быстродействия. А значит, не все ключи оптимизации задействованы или нужно другую либу math подключить. Вот я и хочу выяснить, есть ли более лучший вариант реализации или мне пасти нечего?

Кому-то нужно быстродействие в ущерб точности, кому-то - точность в ущерб быстродействию. Не исключено, что та же glibc всё делает быстро, но это уже линух. А вот newlib, скорее, будет напирать на точность.

Короче, сделайте свой синус, кто же мешает? Подсунуть свою функцию вместо библиотечной - дело нехитрое, ЕМНИП.

Цитата

repstosw 18

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

scifi 1

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

repstosw 18

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

scifi 1

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

repstosw 18

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

scifi 1

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

repstosw 18

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

scifi 1

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

aaarrr 63

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

repstosw 18

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

scifi 1

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

repstosw 18

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

scifi 1

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

repstosw 18

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

scifi 1

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

Присоединяйтесь к обсуждению

Обзор

Активность