Порекомендуйте какое-нибудь softcore

Ответить

Mahagam 0

20 октября, 2008

Опубликовано 20 октября, 2008 · Жалоба

а) Вы хотите за 1 такт что-то большее, чем R3=R1+R2? Это идеология всех современных ядер, начиная от микроблэйзов, ниосов, армов и заканчивая спарками.
б) Память в любой системе - слабое место. Дюже это сколько?

опять упомяну PDP11. например хочется чего-то подобного на add @R1+, @R2+

тут не за такт, но в одну команду совершается много действий. вся соль в том, что шина данных освобождается от выборки кучи команд.

и, кстати, вы неправы относительно, например, АРМа, там в одну команду пихается тьма действий. :wacko: другое дело, что браться за реализацию ядра арма я буду только под принуждением :)

Цитата

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

Leka 1

20 октября, 2008

Опубликовано 20 октября, 2008 · Жалоба

В вариант с внутренней памятью программ/данных можно будет добавить поддержку внешней SPI флешки - для неторопливого выполнения длинного внешнего кода.

Цитата

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

des00 25

22 октября, 2008

Опубликовано 22 октября, 2008 · Жалоба

опять упомяну PDP11. например хочется чего-то подобного на add @R1+, @R2+
тут не за такт, но в одну команду совершается много действий. вся соль в том, что шина данных освобождается от выборки кучи команд.

Года 2-3 назад была подобная тема, помню высказывание SM, он говорил о том что при современном уровне развития электроники идет откат от RISC архитектур в пользу CISC. Т.к. они более гибкие у уже почти не проигрывают в производительности RISC.

PDP11 ИМХО очень красивая архитектура для фпга, вот выйду на пенсию займусь %)

и, кстати, вы неправы относительно, например, АРМа, там в одну команду пихается тьма действий. другое дело, что браться за реализацию ядра арма я буду только под принуждением :)

подход микроблейза по своей сути арм7 и есть %)

Цитата

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

Leka 1

23 октября, 2008

Опубликовано 23 октября, 2008 · Жалоба

Что делаю:
- фон-неймановская архитектура, 32 разряда команда/данные

- внутренняя 2х-портовая память команд/данных

- трехоперандная система команд

- минимальный набор инструкций (алу: + - & | ^ div2, переходы: < <= == != > >=) - 2..4 такта в зависимости от типа адресации (a,*a,*a, proc, *proc).

Примеры:

a = b + c ... *a = *b ^ *c

a += *b[c] ... *a ^= *c

label(a < B ) ... label(*a >= *B )

proc(a) ... *proc(*a) - переход на подпрограмму с передачей аргумента.

Написано и проверено на синтезаторе 3/4 кода, вроде укладывается в ожидаемые <500лут, >75МГц для Спартана. Сначала хотел 16-разрядное АЛУ, но для фон-неймановской архитектуры появляются лишние мультиплексоры(и задержки), поэтому отказался пока от такого варианта.

Дописал, ~400лут ~100МГц для Спартан3, ~300лут ~200МГц для Virtex5. Так что "безрегистровая" архитектура - в самый раз для FPGA, имхо.

Цитата

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

vetal 0

23 октября, 2008

Опубликовано 23 октября, 2008 · Жалоба

Тут рано судить. Надо собирать реальную систему(хотя бы простейшую timer+uart+пару кило внутрикристальной памяти) и смотреть. Для полноты надо еще прерывания, shifter и возможность работать с байтами/шортами.

Если не сложно - соберите ваш код под cyclone и огласите результат.

Ну а дальше - сравнение эффективности на памяти CL2-CL3 без кэша.

Так что "безрегистровая" архитектура - в самый раз для FPGA, имхо.

Я уже упоминал по моему - у вас не безрегистровая архитектура, а регистровая с вынесенным относительно ядра регистровым файлом :) Вопрос стоит как раз в эффективности вынесения.

Цитата

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

Leka 1

23 октября, 2008

Опубликовано 23 октября, 2008 · Жалоба

Цифры для ядра с памятью 2К*32. Установлен только ISE, так что для циклона пока нет возможности синтезировать, но ожидаю сопоставимые цифры. Периферии пока нет, идеология обмена поменялась - все переделывать придется.

Цитата

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

Mahagam 0

27 октября, 2008

Опубликовано 27 октября, 2008 · Жалоба

Цифры для ядра с памятью 2К*32. Установлен только ISE, так что для циклона пока нет возможности синтезировать, но ожидаю сопоставимые цифры. Периферии пока нет, идеология обмена поменялась - все переделывать придется.

что там с новой идеологией?

Цитата

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

Leka 1

27 октября, 2008

Опубликовано 27 октября, 2008 (изменено) · Жалоба

что там с новой идеологией?

Обмен с периферией только в виде выполнения внешней команды c=ext(f,a,b ), где f - номер внешней команды/устройства, любой тип адресации a,b,c. Чтобы можно было, например: умножение f=1 --> c=ext(1,a,b ) --> c=a*b, запись в видеобуфер f=2 c=ext(2,a,b ) --> c=vga[a], vga[a]=b, и тд и тп.

Изменено 27 октября, 2008 пользователем Leka

Цитата

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

des00 25

18 ноября, 2008

Опубликовано 18 ноября, 2008 · Жалоба

Обмен с периферией только в виде выполнения внешней команды c=ext(f,a,b ), где f - номер внешней команды/устройства, любой тип адресации a,b,c. Чтобы можно было, например: умножение f=1 --> c=ext(1,a,b ) --> c=a*b, запись в видеобуфер f=2 c=ext(2,a,b ) --> c=vga[a], vga[a]=b, и тд и тп.

решил пройтись по opencores

а вот это не безрегистровый ли процессор ? :))

http://opencores.org/projects.cgi/web/tiny8/overview

The registers resides in RAM addressed via a base pointer in the WP register (like the TMS9900).

Цитата

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

Leka 1

18 ноября, 2008

Опубликовано 18 ноября, 2008 · Жалоба

Описание(архитектура, система команд, ...) - интересно взглянуть, но логина нет пока(запрос послал). Свой опробовал на простом примере(вывод фонта в цикле на VGA), и отложил в сторону, сейчас главное - прикрутить ЯВУ. Требования к ЯВУ:

1) из распространенных, с исходниками,

2) легко настраиваемый компилятор - самокомпилирующийся, и с минимумом

машинно-зависимого кода(<1К строк),

3) генерация компактного(<2Кслов) кода.

Цитата

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

des00 25

19 ноября, 2008

Опубликовано 19 ноября, 2008 · Жалоба

Описание(архитектура, система команд, ...) - интересно взглянуть, но логина нет пока(запрос послал).

Если еще не пришло

tiny8.tar.tar

Цитата

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

Leka 1

19 ноября, 2008

Опубликовано 19 ноября, 2008 · Жалоба

Посмотрел, самый информативный файл - opcodes.txt, имхо. Что заметил:

1) load/store архитектура - косвенная адресация только для команды MOV(не считая JMP),

2) отсутствие команды перехода на подпрограмму,

3) основные команды - 3х-байтные,

4) отсутствие IN/OUT команд.

По поводу ЯВУ - пересмотрел кучу проектов в инете - так и не выбрал

какой-либо за основу - хард оказывается намного мягче софта.

Цитата

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

Leka 1

21 января, 2009

Опубликовано 21 января, 2009 · Жалоба

Пишу компилятор автокода "безрегистрового"(с регистровым файлом на памяти) софт-ядра:

- более низкий уровень - только в машинных кодах

- построчная запись операторов

- оптимизация только в пределах строки

- одна строка на автокоде может транслироваться в несколько машинных команд

- отсутствие типов - всегда подразумевается "integer"

- отсутствие адресных операторов и типов - только индексная адресация

Цель введенных ограничений - переносимость программ между разными версиями ядер.

Пример программы "N ферзей" (из ветки "Паскаль для АВР") на автокоде:

procedure queens(N, count)
var 
    arow[N], aleft[N], aright[N], aposs[N]
    poss, place, val, pos
begin    
    count = 0
    val = shl(1, N) - 1
    pos = 1
    arow[1] = 0
    aleft[1] = 0
    aright[1] = 0
    aposs[1] = shr(1, N / 2)
    poss = aposs[1]
    while pos <> 0 
          if poss <> 0 
              place = poss & - poss
              poss &= ~ place 
              if  pos = 1 and poss = 0 and (N & 1) <> 0 
                  count *= 2
              end    
              if pos <> N 
                  aposs[pos] = poss               
                  arow[pos + 1] = arow[pos] | place 
                  aleft[pos + 1] = (aleft[pos] | place) * 2
                  aright[pos + 1] = (aright[pos] | place) / 2 
                  poss = ~ (arow[pos + 1] | aleft[pos + 1] | aright[pos + 1]) & val
                  pos += 1
              else 
                  count += 1
              end
        else
            pos -= 1
            poss = aposs[pos]
        end
    end
    if (N & 1) = 0
        count *= 2
    end 
end

Цитата

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

Leka 1

24 мая, 2009

Опубликовано 24 мая, 2009 · Жалоба

Перерыв был большой в этом проекте...

Посмотрел для Cyclone3 - ~600 ЛУТ, ~80 МГц, 10 блоков M9K.

На LatticeXP2 лучше переносится - ~500 ЛУТ, ~115 МГц, 4 блока памяти (по 18К).

Компилятор в тетрады почти готов (queens компилируется в ~60 команд), дальше тривиально - перевод в машинные коды. Сейчас ~700 строк на Паскале, думаю уложиться в ~1000 строк - рефакторинг проще будет делать. В планах - набить 64 ядра с 0.5Кслов памяти каждое в Spartan3A-DSP, и запустить queens впараллель - сравню с ПК.

Цитата

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

SM 0

25 мая, 2009

Опубликовано 25 мая, 2009 · Жалоба

Вы для Lattice PAR делали? Или оценка по какому-нить Precision? Если PAR не делали, то эту оценку надо выкинуть на свалку.

Цитата

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

Присоединяйтесь к обсуждению

Вы можете написать сейчас и зарегистрироваться позже. Если у вас есть аккаунт, авторизуйтесь, чтобы опубликовать от имени своего аккаунта.

К сожалению, ваш контент содержит запрещённые слова. Пожалуйста, отредактируйте контент, чтобы удалить выделенные ниже слова.

Ответить в этой теме...

× Вставлено с форматированием. Вставить как обычный текст

Разрешено использовать не более 75 эмодзи.

× Ваша ссылка была автоматически встроена. Отображать как обычную ссылку

× Ваш предыдущий контент был восстановлен. Очистить редактор

× Вы не можете вставлять изображения напрямую. Загружайте или вставляйте изображения по ссылке.

Указать URL изображения

Подписчики 0

Mahagam 0

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

Leka 1

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

des00 25

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

Leka 1

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

vetal 0

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

Leka 1

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

Mahagam 0

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

Leka 1

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

des00 25

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

Leka 1

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

des00 25

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

Leka 1

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

Leka 1

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

Leka 1

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

SM 0

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

Присоединяйтесь к обсуждению

Обзор

Активность