count_enable 0 8 июня, 2017 Опубликовано 8 июня, 2017 · Жалоба Дано: от 10 до 100 блоков могущих сгенерировать прерывание. Требуется: подтвердить приём прерывания и записать номер блока в память. Моя логика: Блоки остаются в высоком состоянии пока не получат подтверждения. Приоритетным энкодером выбирать по одному блоку за такт. Желательно чтобы энкодер работал быстрее чем тактовая блоков, чтобы максимально быстро их обслужить. Написал приоритетный энкодер типа: entity spikebuffer is generic( NUMINPUTS: integer:=1000; OUT_WIDTH:integer :=10); Port ( REQ : in STD_LOGIC_VECTOR (NUMINPUTS-1 downto 0); ACK : out STD_LOGIC_VECTOR (NUMINPUTS-1 downto 0); CLK : in STD_LOGIC; AEROUT : out STD_LOGIC_VECTOR (OUT_WIDTH-1 downto 0); --отсюда вылетает номер прерывания 1 за такт DVALID:out STD_LOGIC); end spikebuffer; architecture Behavioral of spikebuffer is begin shifting : PROCESS(clk) VARIABLE highest_switch : integer range 0 to NUMINPUTS := NUMINPUTS; begin if rising_edge(CLK) then ACK<=(others=>'0'); DVALID<='0'; highest_switch := NUMINPUTS; for i in 0 to NUMINPUTS-1 loop if REQ((i)) = '1' then -- ищем прерывания highest_switch := (i); -- последнее найдённое запоминаем DVALID<='1'; end if; end loop; if (highest_switch<NUMINPUTS) then -- если были прерывания AEROUT<=std_logic_vector(to_unsigned(highest_switch,AEROUT'length)); ACK(highest_switch)<='1'; -- то подтверждаем приём и тогда блок отпустит REQ else DVALID<='0'; ACK<=(others=>'0'); end if; end if; end process; К сожалению для 7 виртекса синтезируется на ~140 Mhz. Возможно ли написать требуемый блок быстрее? Как за мин. количество клоков прочитать и запомнить от 0 до 100 прерываний? Цитата Поделиться сообщением Ссылка на сообщение Поделиться на другие сайты Поделиться
Golikov 0 8 июня, 2017 Опубликовано 8 июня, 2017 · Жалоба почему нельзя выбирать за такт из нескольких блоков? Цитата Поделиться сообщением Ссылка на сообщение Поделиться на другие сайты Поделиться
count_enable 0 8 июня, 2017 Опубликовано 8 июня, 2017 · Жалоба А как записать в память? Держать память на каждый блок я не потяну (важна последовательность прерываний а не просто их наличие). Сейчас все номера блоков сливаются в одно долгое FIFO. Надо получить запись типа "1,2,3,0(нет),0,0,3,32,6,3,0,2,4". Вот упрощённая логика разгоняется аж до 157 МГц, а хотелось бы минимум вдвое больше. Причём как я выяснил, тормозом является именно подтверждение ACK(highest_switch)<='1'; Без него скорость увеличивается в разы. shifting : PROCESS(clk) VARIABLE highest_switch : integer range 0 to NUMINPUTS := NUMINPUTS; begin if rising_edge(CLK) then ACK<=(others=>'0'); DVALID<='0'; highest_switch := NUMINPUTS; for i in 0 to NUMINPUTS-1 loop if REQ((i)) = '1' then highest_switch := (i); DVALID<='1'; end if; end loop; ACK(highest_switch)<='1'; end if; end process; end Behavioral; Цитата Поделиться сообщением Ссылка на сообщение Поделиться на другие сайты Поделиться
iosifk 3 8 июня, 2017 Опубликовано 8 июня, 2017 · Жалоба Дано: от 10 до 100 блоков могущих сгенерировать прерывание. Требуется: подтвердить приём прерывания и записать номер блока в память. ... К сожалению для 7 виртекса синтезируется на ~140 Mhz. Возможно ли написать требуемый блок быстрее? Как за мин. количество клоков прочитать и запомнить от 0 до 100 прерываний? Если будете делать параллельный контроллер, как у Интел, то придется задействовать много ресурсов. Сделайте блок по системе DEC, т.е. последовательный. По всем блокам последовательно проходит сигнал разрешения запроса. В каждом блоке - триггер и "И". Если этот блок требует прерывания, то он не пропустит сигнал дальше. И можно дать обратный сигнал, который скажет "младшему" о том, что "старший" хочет прерывание... Ну и дальше дается сигнал "чтения вектора" и тот блок, который "старший", выставит свой вектор, а "младшим" это будет запрещено... Все в один такт при чтении и один такт - для защелкивания запроса каждом в блоке.. Цитата Поделиться сообщением Ссылка на сообщение Поделиться на другие сайты Поделиться
count_enable 0 8 июня, 2017 Опубликовано 8 июня, 2017 · Жалоба Извините, но я не cовсем понял :( Т.е. у нас есть N блоков каждый со входом IRQEN которые соединены в цепочку типа daisy-chain, и первый в этой цепочке перехватывает сигнал и выставляет на общюю шину свой IRQID? Я не совсем понял "последовательно проходит сигнал запроса" - не получится ли это обычный опрос по одному клоку на блок? Цитата Поделиться сообщением Ссылка на сообщение Поделиться на другие сайты Поделиться
iosifk 3 8 июня, 2017 Опубликовано 8 июня, 2017 · Жалоба Извините, но я не cовсем понял :( Т.е. у нас есть N блоков каждый со входом IRQEN которые соединены в цепочку типа daisy-chain, и первый в этой цепочке перехватывает сигнал и выставляет на общюю шину свой IRQID? Я не совсем понял "последовательно проходит сигнал запроса" - не получится ли это обычный опрос по одному клоку на блок? Ну да, это daisy-chain... Разрешения проходят через блоки, как бусы на нитке. Блок либо пропускает разрешение, либо не пропускает разрешение к следующему блоку. И далее есть обратный сигнал от "верхних" блоков к "нижним", который блокирует нижним выставление вектора при чтении... Если хотите подробнее, то могу по скайпу голосом... Цитата Поделиться сообщением Ссылка на сообщение Поделиться на другие сайты Поделиться
count_enable 0 8 июня, 2017 Опубликовано 8 июня, 2017 · Жалоба Большое вам спасибо! Думаю понял как оно. А зачем сигнал блокады? Мы ведь можем по дефолту запретить блокам выставлять что-либо кроме Hi-Z без разрешения? Цитата Поделиться сообщением Ссылка на сообщение Поделиться на другие сайты Поделиться
Golikov 0 8 июня, 2017 Опубликовано 8 июня, 2017 · Жалоба ну да с наиболее приоритетного конца соединить их через мультиплексор. Если прерывание горит, то выход вбок, если нет, то выход на следующий блок. Подать единичку, она "добежит" до самого первого прерывания, и выйдет в бок. Дальше на все прерывания подать АСК объединенный по & с вышедшей единичкой. Ну и общий 1 хот дешифратор в адрес. Цитата Поделиться сообщением Ссылка на сообщение Поделиться на другие сайты Поделиться
iosifk 3 8 июня, 2017 Опубликовано 8 июня, 2017 · Жалоба Большое вам спасибо! Думаю понял как оно. А зачем сигнал блокады? Мы ведь можем по дефолту запретить блокам выставлять что-либо кроме Hi-Z без разрешения? Внутри ПЛИС Hi-Z не действуют... И без обратного сигнала при подаче "чтения вектора" все блоки, хотящие прерывания выставят 1, а не хотящие - 0. Получите слово из 100 бит. Которое потом надо будет "свернуть" в "адрес вектора". А при использовании запрета для "нижних", самый "верхний" выставит уже готовый "адрес вектора", который может быть в него намертво зашит, или загружен ему в регистр... Цитата Поделиться сообщением Ссылка на сообщение Поделиться на другие сайты Поделиться
Golikov 0 8 июня, 2017 Опубликовано 8 июня, 2017 · Жалоба можно чтобы блок выставлял адрес если 1 вбок или 0, если нет единички и адреса все по ИЛИ соединить. то есть снизу единичка, если прерывание есть, то на выход адрес и 1, и вверх 0, если прерывания нет, то на выход адрес 0 и 0, и вверх 1. И все модули соединяем друг за другом. Адреса по ИЛИ. АСК по И со вторым выходом. Цитата Поделиться сообщением Ссылка на сообщение Поделиться на другие сайты Поделиться
RobFPGA 33 8 июня, 2017 Опубликовано 8 июня, 2017 · Жалоба Приветствую! Поиск решения без понимания задачи. Моя логика: Блоки остаются в высоком состоянии пока не получат подтверждения. Приоритетным энкодером выбирать по одному блоку за такт. Желательно чтобы энкодер работал быстрее чем тактовая блоков, чтобы максимально быстро их обслужить. Первое не стыкуется со вторым А как записать в память? Держать память на каждый блок я не потяну (важна последовательность прерываний а не просто их наличие). Сейчас все номера блоков сливаются в одно долгое FIFO. Надо получить запись типа "1,2,3,0(нет),0,0,3,32,6,3,0,2,4". ... Сохранение порядок генерации прерываний Ваша схема не гарантирует (вернее он будет только если за цикл опроса сигналов будет только одно прерывание). А если несколько? При daisy-chain будут большие latency при реакции на прерывания. Опят же Ваши требования тут универсальные но уж слишком общие "... чтобы работал быстрее ...". :) Думаю что тут можно делать каскадную схему - делить вектор на группы и обрабатывать их независимыми арбитрами которые потом также арбитрировать. Будет Вам и скорость и latency. Удачи! Rob. Цитата Поделиться сообщением Ссылка на сообщение Поделиться на другие сайты Поделиться
count_enable 0 9 июня, 2017 Опубликовано 9 июня, 2017 · Жалоба Внутри ПЛИС Hi-Z не действуют... ЕМНИП синтезатор заменяет их на wire OR вполне успешно, иначе я не совсем понял как "запретить" блоку выставлять что-то на общую шину. Все блоки сидят на одной "IRQNUM" и должны какое-то состояние выставить. Разве нет? Написал согласно Вашим рецептам, но с hi-z, синтезировалось и симулируется. Показывает 446 МГц для 100 блоков - вполне неплохо, хотя на большие "гирлянды" конечно масштабировать не стоит. Теперь о каскадировании. Уважаемый RobFPGA, это была моя начальная идея, но я так и не придумал как потом объединять несколько выходных потоков в реальном времени. Я немного неправильно описал систему, слишком упрощённо. Не хочу перегружать деталями. Точный порядок прерываний не нужен, они квантуются каждые несколько десятков клоков - т.е. внутри этого окна они могут быть перемешаны, но обрабатывать их после этого окна нежелательно. Окна формируются прерыванием от Глобального Оконного Таймера (ГОТ). Т.е. между двумя событиями ГОТ порядок остальных прерываний роли не играет. Общая логика такова: каждый блок может заявить прервание каждые Х клоков. Если Х>N то задача тривиальна но обычный случай это N=100..200 X=20, частота ок.300 МГц. Т.е. в критичном случае у нас будет 200 прерываний и 20 циклов (300 МГц) на обработку. Если прерывание не было обслужено на протяжении 20 циклов то поднимается флаг "ПРОСРОЧЕН" который тормозит конвеер пока все прерывания не обработают. Обработка прерывания - запись его в большую очередь. Соответственно задача стоит обработать макс. число прерываний за мин. время. Подход двоякий: во-первый второй тактовый сигнал большей частоты, во-вторых минимальное число клоков на обработку. Если поделить все блоки на группы меньше 20 то задача банально решается опросом. Но после этого у нас есть N/20 независимых очередей которые надо склеить в одну сохранив порядок окон ГОТ. Мои неуклюжие попытки (поллинг мастеров и поочередная выгрузка очередей "до следующего ГОТа") к сожалению получались неудобными и медленными. Я подозреваю надо обьеденить подходы, или сделав daisy-chain из локальных мастеров, или наоборот, сделать дерево где локальные мастера будут короткими daisy-chain цепочками (10 блоков синтезируются на ок.800 Мгц). Я продолжаю экспериментировать, и буду благодарен за новые идеи. Цитата Поделиться сообщением Ссылка на сообщение Поделиться на другие сайты Поделиться
Golikov 0 9 июня, 2017 Опубликовано 9 июня, 2017 · Жалоба так если у вас не 1 такт, то лучше обрабатывать маленькими порциями. 100 за 1 такт - долго, 10 за 1 такт быстрее, причем значительно, а за следующий вам из 10 ответов опять надо будет выбрать 1. То есть 1 по 100 меняем на 2 по 10, и получаем сильный прирост. можно собирать очереди прерываний с метками времени, и потом их сливать в один поток в порядке приоритетов... Цитата Поделиться сообщением Ссылка на сообщение Поделиться на другие сайты Поделиться
RobFPGA 33 9 июня, 2017 Опубликовано 9 июня, 2017 · Жалоба Приветствую! порядок прерываний не нужен, они квантуются каждые несколько десятков клоков - т.е. внутри этого окна они могут быть перемешаны, но обрабатывать их после этого окна нежелательно. Окна формируются прерыванием от Глобального Оконного Таймера (ГОТ). Т.е. между двумя событиями ГОТ порядок остальных прерываний роли не играет. Ну так это значительно упрощает задачу. Раз есть глобальный таймер значит можно иметь и НОМЕР окна в котором появились прерывании. Если поделить все блоки на группы меньше 20 то задача банально решается опросом. Но после этого у нас есть N/20 независимых очередей которые надо склеить в одну сохранив порядок окон ГОТ. Мои неуклюжие попытки (поллинг мастеров и поочередная выгрузка очередей "до следующего ГОТа") к сожалению получались неудобными и медленными. В очередь пишем и номер окна а при чтении из текущей очереди читаем с отслеживанием номера. Или еще проще - в каждую очередь ВСЕГДА пишем бит окончания окна, а на выходе читаем из каждой очереди пока не увидим это бит а затем переходим к чтению следующей по кольцу. Удачи! Rob. Цитата Поделиться сообщением Ссылка на сообщение Поделиться на другие сайты Поделиться