sqrt - Страница 2 - Языки проектирования на ПЛИС (FPGA)

sqrt

Ответить

Leka 1

2 мая, 2013

Опубликовано 2 мая, 2013 (изменено) · Жалоба

Не ту ссылку дал, перепутал с делением.

Уоррен "Алгоритмические трюки для программистов", там есть "аппаратный" алгоритм на Си:

unsigned x, y;
unsigned sqrt(){
  y = 0;
  unsigned m = 1 << 30;    
  while( m ){
    unsigned b =  y | m;
    y >>= 1;
    if( x >= b ){ 
        x -= b; 
        y |= m; 
    }             
    m >>= 2;
  }    
}

Изменено 2 мая, 2013 пользователем Leka

Цитата

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

Timmy 1

3 мая, 2013

Опубликовано 3 мая, 2013 · Жалоба

Там код оптимизирован под ECP2, чтобы его собрать в общем виде, надо сменить архитектуры add_sub, add_mux на common.

А вообще этот ужас надо переписать по нормальному non-restoring алгоритму, но руки пока не дошли, и так работает и в 200МГц укладывается.

sqrt.7z

Цитата

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

Maverick_ 15

3 мая, 2013

Опубликовано 3 мая, 2013 · Жалоба

Не ту ссылку дал, перепутал с делением.
Уоррен "Алгоритмические трюки для программистов", там есть "аппаратный" алгоритм на Си:
unsigned x, y;
unsigned sqrt(){
  y = 0;
  unsigned m = 1 << 30;    
  while( m ){
    unsigned b =  y | m;
    y >>= 1;
    if( x >= b ){ 
        x -= b; 
        y |= m; 
    }             
    m >>= 2;
  }    
}

Вы мне не расскажите цифра 30 для m это ограничение или как?

Алгоритм похож на мой найденный :) и приведено для него описание (последнее)

Цитата

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

Leka 1

3 мая, 2013

Опубликовано 3 мая, 2013 · Жалоба

цифра 30 для m это ограничение или как?

Это упрощение для 32-разрядного процессора, для FPGA такого ограничения нет.

Цитата

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

Maverick_ 15

3 мая, 2013

Опубликовано 3 мая, 2013 · Жалоба

Если кто-то перепишит состояние calc (описание в сообщении), чтобы увеличить быстродействие (понимаю, что при этом увеличится число тактов на вычисление квадратного корня и скорее всего понадобиться большее кол-во состояний автомата)... Буду благодарен...

PS Вижу, что нужно

op <= op - (res+one);

разнести вычисление по времени...

Цитата

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

Leka 1

3 мая, 2013

Опубликовано 3 мая, 2013 · Жалоба

вместо op <= op - (res + one);

можно op <= op - (res | one); //или "OR" (не знаю, как надо в VHDL)

в Спартанах это один уровень логики займет, не считая переноса.

Цитата

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

Maverick_ 15

3 мая, 2013

Опубликовано 3 мая, 2013 · Жалоба

вместо op <= op - (res + one);
можно op <= op - (res | one); //или "OR" (не знаю, как надо в VHDL)

в Спартанах это один уровень логики займет, не считая переноса.

заменил в 2-х местах (в тех строчках - в коментариях "старое" описание), увеличил быстродействие на ~10 МГц (только здесь Generic ( b = 32), в ранее приведенном 16 - пишу чтобы учитывали в тетсбенче). Сравнение проводил для 32 битных входных данных. ПЛИС - Spartan 6.

-- algorithm in C code
------------
--int sqrt(int num) {
--    int op = num;
--    int res = 0;
--    int one = 1 << 30; // The second-to-top bit is set: 1L<<30 for long
--
--    // "one" starts at the highest power of four <= the argument.
--    while (one > op)
--        one >>= 2;
--  
--    while (one != 0) {
--        if (op >= res + one) {
--            op -= res + one;
--            res += 2 * one;
--        }
--        res >>= 1;
--        one >>= 2;
--    }
--    return res;
--}
-----------



library IEEE;
use IEEE.STD_LOGIC_1164.ALL;
use IEEE.NUMERIC_STD.ALL;

entity SQRT is
    Generic ( b  : natural range 4 to 32 := 32 );
    Port ( clk    : in   STD_LOGIC;
           start  : in   STD_LOGIC;
           value  : in   STD_LOGIC_VECTOR (31 downto 0);
           result : out  STD_LOGIC_VECTOR (15 downto 0);
           busy   : out  STD_LOGIC);
end SQRT;

architecture Behave of SQRT is
signal op  : unsigned(b-1 downto 0); --
signal res : unsigned(b-1 downto 0); --
signal one : unsigned(b-1 downto 0); --

signal bits : integer range b downto 0;
type aaa is (idle, shift, calc, done);
signal z : aaa;

begin
   process begin
      wait until rising_edge(clk);
      case z is
         when idle =>
            if (start='1') then
               z <= shift;
               busy <= '1';
            end if;
            one <= to_unsigned(2**(b-2),b);
            op  <= unsigned(value);
            res <= (others=>'0');

         when shift =>
            if (one > op) then
               one <= one/4;
            else
               z   <= calc;
            end if;

         when calc =>
            if (one /= 0) then
             if (op >= res+one) then
                 op   <= op - (res or one); --op   <= op - (res+one);
                  res  <= res/2 or one; --res  <= res/2 + one;
               else
                  res  <= res/2;
               end if;
               one <= one/4;
            else
               z    <= done;
            end if;
            
         when done =>
            busy <= '0';
            if (start='0') then
               z <= idle;
            end if;
      end case;
   end process;
  
   result <= std_logic_vector(res(result'range));
end;

Цитата

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

Leka 1

3 мая, 2013

Опубликовано 3 мая, 2013 · Жалоба

Быстродействие должно ограничиваться только этим:

if (op >= (res or one)) then

op <= op - (res or one);

Можно попробовать оптимизировать описание этого кусочка по результатам синтеза, например на Верилоге (VHDL не знаю):

wire[32:0] tmp = op - (res | one);

...

if(!tmp[32]) op <= tmp;

Д/б >200МГц

Цитата

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

Maverick_ 15

6 мая, 2013

Опубликовано 6 мая, 2013 · Жалоба

signal bits : integer range b downto 0;

можно удалить...

в последнем приведенном описании...

Цитата

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

eugen_pcad_ru 0

6 мая, 2013

Опубликовано 6 мая, 2013 · Жалоба

Тут уже много рекомендаций:)

Если ни одна не устроит, то была где-то древняя реализация на АHDL. Если нужно, пишите в личку, поищу.

Цитата

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

Maverick_ 15

6 мая, 2013

Опубликовано 6 мая, 2013 · Жалоба

Всем спасибо.

Цитата

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

Maverick_ 15

21 июля, 2013

Опубликовано 21 июля, 2013 · Жалоба

добавлю еще алгоритм

Цитата

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

ukpyr 0

21 июля, 2013

Опубликовано 21 июля, 2013 (изменено) · Жалоба

еще вариация (16 бит, но расширяется до 32 или 64 бита):

uint8_t sqrt16(uint16_t n) {
    uint8_t  guess = 0x00;
    uint8_t  bit   = 0x80;
    
    do {
        uint8_t  guess1 = guess | bit;
        if (n > (guess1 * guess1)) guess = guess1;
        bit >>= 1;
    } while (bit);
    
    return guess;
}

Изменено 21 июля, 2013 пользователем ukpyr

Цитата

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

Kuzmi4 0

22 июля, 2013

Опубликовано 22 июля, 2013 · Жалоба

А как кто решает проблемы с дробными частями, ну что там после запятой ?

Потому как, например, вышеприведённый пример вычисления корня даёт нам для входного значения "35" - результат "5", то есть 0.916... остались неучтёнными..

Цитата

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

Присоединяйтесь к обсуждению

Вы можете написать сейчас и зарегистрироваться позже. Если у вас есть аккаунт, авторизуйтесь, чтобы опубликовать от имени своего аккаунта.

К сожалению, ваш контент содержит запрещённые слова. Пожалуйста, отредактируйте контент, чтобы удалить выделенные ниже слова.

Ответить в этой теме...

× Вставлено с форматированием. Вставить как обычный текст

Разрешено использовать не более 75 эмодзи.

× Ваша ссылка была автоматически встроена. Отображать как обычную ссылку

× Ваш предыдущий контент был восстановлен. Очистить редактор

× Вы не можете вставлять изображения напрямую. Загружайте или вставляйте изображения по ссылке.

Указать URL изображения

Подписчики 0

Leka 1

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

Timmy 1

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

Timmy 1

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

Maverick_ 15

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

Leka 1

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

Maverick_ 15

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

Leka 1

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

Maverick_ 15

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

Leka 1

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

Maverick_ 15

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

eugen_pcad_ru 0

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

Maverick_ 15

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

Maverick_ 15

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

ukpyr 0

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

Kuzmi4 0

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

Присоединяйтесь к обсуждению

Обзор

Активность