Как сделать быстрый Priority encoder

Ответить

count_enable 0

8 июня, 2017

Опубликовано 8 июня, 2017 · Жалоба

Дано: от 10 до 100 блоков могущих сгенерировать прерывание. Требуется: подтвердить приём прерывания и записать номер блока в память.

Моя логика: Блоки остаются в высоком состоянии пока не получат подтверждения. Приоритетным энкодером выбирать по одному блоку за такт. Желательно чтобы энкодер работал быстрее чем тактовая блоков, чтобы максимально быстро их обслужить.

Написал приоритетный энкодер типа:

entity spikebuffer is
generic( NUMINPUTS: integer:=1000;
            OUT_WIDTH:integer :=10);
    Port ( REQ : in  STD_LOGIC_VECTOR (NUMINPUTS-1 downto 0);
              ACK : out  STD_LOGIC_VECTOR (NUMINPUTS-1 downto 0);
           CLK : in  STD_LOGIC;
           AEROUT : out  STD_LOGIC_VECTOR (OUT_WIDTH-1 downto 0);  --отсюда вылетает номер прерывания 1 за такт
              DVALID:out STD_LOGIC);
end spikebuffer;

architecture Behavioral of spikebuffer is


begin

shifting : PROCESS(clk)
   VARIABLE highest_switch : integer range 0 to NUMINPUTS := NUMINPUTS;
begin
if rising_edge(CLK) then
ACK<=(others=>'0');
DVALID<='0';
highest_switch := NUMINPUTS;
   for i in 0 to NUMINPUTS-1  loop
      if REQ((i)) = '1' then                       -- ищем прерывания
         highest_switch := (i);                -- последнее найдённое запоминаем
            DVALID<='1';
      end if;
   end loop;
    if (highest_switch<NUMINPUTS) then   -- если были прерывания
        AEROUT<=std_logic_vector(to_unsigned(highest_switch,AEROUT'length));
        ACK(highest_switch)<='1';       -- то подтверждаем приём и тогда блок отпустит REQ
    else
        DVALID<='0';
        ACK<=(others=>'0');
    end if;
end if;
end process;

К сожалению для 7 виртекса синтезируется на ~140 Mhz. Возможно ли написать требуемый блок быстрее? Как за мин. количество клоков прочитать и запомнить от 0 до 100 прерываний?

Цитата

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

Golikov 0

8 июня, 2017

Опубликовано 8 июня, 2017 · Жалоба

почему нельзя выбирать за такт из нескольких блоков?

Цитата

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

count_enable 0

8 июня, 2017

Опубликовано 8 июня, 2017 · Жалоба

А как записать в память? Держать память на каждый блок я не потяну (важна последовательность прерываний а не просто их наличие). Сейчас все номера блоков сливаются в одно долгое FIFO. Надо получить запись типа "1,2,3,0(нет),0,0,3,32,6,3,0,2,4".

Вот упрощённая логика разгоняется аж до 157 МГц, а хотелось бы минимум вдвое больше. Причём как я выяснил, тормозом является именно подтверждение ACK(highest_switch)<='1'; Без него скорость увеличивается в разы.

shifting : PROCESS(clk)
   VARIABLE highest_switch : integer range 0 to NUMINPUTS := NUMINPUTS;
begin
if rising_edge(CLK) then
ACK<=(others=>'0');
DVALID<='0';
highest_switch := NUMINPUTS;
   for i in 0 to NUMINPUTS-1  loop
      if REQ((i)) = '1' then 
         highest_switch := (i);
            DVALID<='1';
      end if;
   end loop;
    ACK(highest_switch)<='1';
end if;
end process;

end Behavioral;

Цитата

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

iosifk 3

8 июня, 2017

Опубликовано 8 июня, 2017 · Жалоба

Дано: от 10 до 100 блоков могущих сгенерировать прерывание. Требуется: подтвердить приём прерывания и записать номер блока в память.

...

К сожалению для 7 виртекса синтезируется на ~140 Mhz. Возможно ли написать требуемый блок быстрее? Как за мин. количество клоков прочитать и запомнить от 0 до 100 прерываний?

Если будете делать параллельный контроллер, как у Интел, то придется задействовать много ресурсов.

Сделайте блок по системе DEC, т.е. последовательный. По всем блокам последовательно проходит сигнал разрешения запроса. В каждом блоке - триггер и "И". Если этот блок требует прерывания, то он не пропустит сигнал дальше. И можно дать обратный сигнал, который скажет "младшему" о том, что "старший" хочет прерывание...

Ну и дальше дается сигнал "чтения вектора" и тот блок, который "старший", выставит свой вектор, а "младшим" это будет запрещено...

Все в один такт при чтении и один такт - для защелкивания запроса каждом в блоке..

Цитата

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

count_enable 0

8 июня, 2017

Опубликовано 8 июня, 2017 · Жалоба

Извините, но я не cовсем понял :(

Т.е. у нас есть N блоков каждый со входом IRQEN которые соединены в цепочку типа daisy-chain, и первый в этой цепочке перехватывает сигнал и выставляет на общюю шину свой IRQID?

Я не совсем понял "последовательно проходит сигнал запроса" - не получится ли это обычный опрос по одному клоку на блок?

Цитата

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

iosifk 3

8 июня, 2017

Опубликовано 8 июня, 2017 · Жалоба

Извините, но я не cовсем понял :(

Т.е. у нас есть N блоков каждый со входом IRQEN которые соединены в цепочку типа daisy-chain, и первый в этой цепочке перехватывает сигнал и выставляет на общюю шину свой IRQID?

Я не совсем понял "последовательно проходит сигнал запроса" - не получится ли это обычный опрос по одному клоку на блок?

Ну да, это daisy-chain... Разрешения проходят через блоки, как бусы на нитке. Блок либо пропускает разрешение, либо не пропускает разрешение к следующему блоку.

И далее есть обратный сигнал от "верхних" блоков к "нижним", который блокирует нижним выставление вектора при чтении...

Если хотите подробнее, то могу по скайпу голосом...

Цитата

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

count_enable 0

8 июня, 2017

Опубликовано 8 июня, 2017 · Жалоба

Большое вам спасибо! Думаю понял как оно. А зачем сигнал блокады? Мы ведь можем по дефолту запретить блокам выставлять что-либо кроме Hi-Z без разрешения?

Цитата

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

Golikov 0

8 июня, 2017

Опубликовано 8 июня, 2017 · Жалоба

ну да с наиболее приоритетного конца соединить их через мультиплексор. Если прерывание горит, то выход вбок, если нет, то выход на следующий блок. Подать единичку, она "добежит" до самого первого прерывания, и выйдет в бок. Дальше на все прерывания подать АСК объединенный по & с вышедшей единичкой. Ну и общий 1 хот дешифратор в адрес.

Цитата

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

iosifk 3

8 июня, 2017

Опубликовано 8 июня, 2017 · Жалоба

Большое вам спасибо! Думаю понял как оно. А зачем сигнал блокады? Мы ведь можем по дефолту запретить блокам выставлять что-либо кроме Hi-Z без разрешения?

Внутри ПЛИС Hi-Z не действуют...

И без обратного сигнала при подаче "чтения вектора" все блоки, хотящие прерывания выставят 1, а не хотящие - 0. Получите слово из 100 бит. Которое потом надо будет "свернуть" в "адрес вектора". А при использовании запрета для "нижних", самый "верхний" выставит уже готовый "адрес вектора", который может быть в него намертво зашит, или загружен ему в регистр...

Цитата

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

Golikov 0

8 июня, 2017

Опубликовано 8 июня, 2017 · Жалоба

можно чтобы блок выставлял адрес если 1 вбок или 0, если нет единички и адреса все по ИЛИ соединить.

то есть снизу единичка, если прерывание есть, то на выход адрес и 1, и вверх 0, если прерывания нет, то на выход адрес 0 и 0, и вверх 1. И все модули соединяем друг за другом. Адреса по ИЛИ. АСК по И со вторым выходом.

Цитата

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

RobFPGA 33

8 июня, 2017

Опубликовано 8 июня, 2017 · Жалоба

Приветствую!

Поиск решения без понимания задачи.

Моя логика: Блоки остаются в высоком состоянии пока не получат подтверждения. Приоритетным энкодером выбирать по одному блоку за такт. Желательно чтобы энкодер работал быстрее чем тактовая блоков, чтобы максимально быстро их обслужить.

Первое не стыкуется со вторым

А как записать в память? Держать память на каждый блок я не потяну (важна последовательность прерываний а не просто их наличие). Сейчас все номера блоков сливаются в одно долгое FIFO. Надо получить запись типа "1,2,3,0(нет),0,0,3,32,6,3,0,2,4".
...

Сохранение порядок генерации прерываний Ваша схема не гарантирует (вернее он будет только если за цикл опроса сигналов будет только одно прерывание). А если несколько?

При daisy-chain будут большие latency при реакции на прерывания. Опят же Ваши требования тут универсальные но уж слишком общие "... чтобы работал быстрее ...". :)

Думаю что тут можно делать каскадную схему - делить вектор на группы и обрабатывать их независимыми арбитрами которые потом также арбитрировать. Будет Вам и скорость и latency.

Удачи! Rob.

Цитата

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

count_enable 0

9 июня, 2017

Опубликовано 9 июня, 2017 · Жалоба

Внутри ПЛИС Hi-Z не действуют...

ЕМНИП синтезатор заменяет их на wire OR вполне успешно, иначе я не совсем понял как "запретить" блоку выставлять что-то на общую шину. Все блоки сидят на одной "IRQNUM" и должны какое-то состояние выставить. Разве нет?

Написал согласно Вашим рецептам, но с hi-z, синтезировалось и симулируется. Показывает 446 МГц для 100 блоков - вполне неплохо, хотя на большие "гирлянды" конечно масштабировать не стоит.

Теперь о каскадировании. Уважаемый RobFPGA, это была моя начальная идея, но я так и не придумал как потом объединять несколько выходных потоков в реальном времени.

Я немного неправильно описал систему, слишком упрощённо. Не хочу перегружать деталями. Точный порядок прерываний не нужен, они квантуются каждые несколько десятков клоков - т.е. внутри этого окна они могут быть перемешаны, но обрабатывать их после этого окна нежелательно. Окна формируются прерыванием от Глобального Оконного Таймера (ГОТ). Т.е. между двумя событиями ГОТ порядок остальных прерываний роли не играет.

Общая логика такова: каждый блок может заявить прервание каждые Х клоков. Если Х>N то задача тривиальна но обычный случай это N=100..200 X=20, частота ок.300 МГц. Т.е. в критичном случае у нас будет 200 прерываний и 20 циклов (300 МГц) на обработку. Если прерывание не было обслужено на протяжении 20 циклов то поднимается флаг "ПРОСРОЧЕН" который тормозит конвеер пока все прерывания не обработают.

Обработка прерывания - запись его в большую очередь.

Соответственно задача стоит обработать макс. число прерываний за мин. время. Подход двоякий: во-первый второй тактовый сигнал большей частоты, во-вторых минимальное число клоков на обработку.

Если поделить все блоки на группы меньше 20 то задача банально решается опросом. Но после этого у нас есть N/20 независимых очередей которые надо склеить в одну сохранив порядок окон ГОТ. Мои неуклюжие попытки (поллинг мастеров и поочередная выгрузка очередей "до следующего ГОТа") к сожалению получались неудобными и медленными.

Я подозреваю надо обьеденить подходы, или сделав daisy-chain из локальных мастеров, или наоборот, сделать дерево где локальные мастера будут короткими daisy-chain цепочками (10 блоков синтезируются на ок.800 Мгц).

Я продолжаю экспериментировать, и буду благодарен за новые идеи.

Цитата

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

Golikov 0

9 июня, 2017

Опубликовано 9 июня, 2017 · Жалоба

так если у вас не 1 такт, то лучше обрабатывать маленькими порциями.

100 за 1 такт - долго,

10 за 1 такт быстрее, причем значительно, а за следующий вам из 10 ответов опять надо будет выбрать 1. То есть 1 по 100 меняем на 2 по 10, и получаем сильный прирост.

можно собирать очереди прерываний с метками времени, и потом их сливать в один поток в порядке приоритетов...

Цитата

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

RobFPGA 33

9 июня, 2017

Опубликовано 9 июня, 2017 · Жалоба

Приветствую!

порядок прерываний не нужен, они квантуются каждые несколько десятков клоков - т.е. внутри этого окна они могут быть перемешаны, но обрабатывать их после этого окна нежелательно. Окна формируются прерыванием от Глобального Оконного Таймера (ГОТ). Т.е. между двумя событиями ГОТ порядок остальных прерываний роли не играет.

Ну так это значительно упрощает задачу.

Раз есть глобальный таймер значит можно иметь и НОМЕР окна в котором появились прерывании.

Если поделить все блоки на группы меньше 20 то задача банально решается опросом. Но после этого у нас есть N/20 независимых очередей которые надо склеить в одну сохранив порядок окон ГОТ.
Мои неуклюжие попытки (поллинг мастеров и поочередная выгрузка очередей "до следующего ГОТа") к сожалению получались неудобными и медленными.

В очередь пишем и номер окна а при чтении из текущей очереди читаем с отслеживанием номера.

Или еще проще - в каждую очередь ВСЕГДА пишем бит окончания окна, а на выходе читаем из каждой очереди пока не увидим это бит а затем переходим к чтению следующей по кольцу.

Удачи! Rob.

Цитата

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

Присоединяйтесь к обсуждению

Вы можете написать сейчас и зарегистрироваться позже. Если у вас есть аккаунт, авторизуйтесь, чтобы опубликовать от имени своего аккаунта.

К сожалению, ваш контент содержит запрещённые слова. Пожалуйста, отредактируйте контент, чтобы удалить выделенные ниже слова.

Ответить в этой теме...

× Вставлено с форматированием. Вставить как обычный текст

Разрешено использовать не более 75 эмодзи.

× Ваша ссылка была автоматически встроена. Отображать как обычную ссылку

× Ваш предыдущий контент был восстановлен. Очистить редактор

× Вы не можете вставлять изображения напрямую. Загружайте или вставляйте изображения по ссылке.

Указать URL изображения

Подписчики 0

count_enable 0

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

Golikov 0

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

count_enable 0

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

iosifk 3

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

count_enable 0

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

iosifk 3

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

count_enable 0

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

Golikov 0

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

iosifk 3

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

Golikov 0

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

RobFPGA 33

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

count_enable 0

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

Golikov 0

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

RobFPGA 33

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

Присоединяйтесь к обсуждению

Обзор

Активность