Поставил эту версию, проблема исчезла, и уменьшился код: при компиляции в обоих случаях выдает 168 байт.
Спасибо за подсказку, так действительно получается более оптимально.
Листинг смотрел, там действительно в одном случае функция вызывается, а в другом подставляется.
Только я так и не понял, почему компилятор подставляет 100 байт тела функции, вместо того чтобы вызвать функцию 3 байтами.