Перейти к содержанию
    

Full Custom ALU дизайн для оптимизации алгоритма

Итак задача: Имплементировать на FPGA ( Altera Stratix V ) ALU, который даст max скорость сортировки binary tree простейшего типа (тип структуры ниже).

Также рассматриваются стандартные реализации, как Ripple Carry and Carry Look Ahead ALUs.

 

Если кто занимался подобными вещами - делитесь опытом! :beer:

 

struct node

{

int key_value;

node *left;

node *right;

};

 

class btree

{

public:

node *root;

 

btree();

~btree();

 

void print_item (node* node);

void insert(int key);

node *search(int key);

void destroy_tree();

 

private:

void destroy_tree(node *leaf);

void insert(int key, node *leaf);

node *search(int key, node *leaf);

};

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

отсортировать по возрастанию/убыванию элементарно, код на форуме выкладывался. на сыклоне 3 ем, будет работать где то на 160-200МГц. а вот что вам конкретно нужно можно подробнее? В том числе организация интерфейсов ?

 

ЗЫ. вы дали хедер класса, а где его тело ?

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

отсортировать по возрастанию/убыванию элементарно, код на форуме выкладывался. на сыклоне 3 ем, будет работать где то на 160-200МГц.

Ok, спасибо ща посмотрю. Если вы где-то публиковали подобные вещи в своих статьях (некоторые я уже прочел - по STA у вас очень хороший пример :a14: ), пожалуйста, дайте ссылки

 

а вот что вам конкретно нужно можно подробнее? В том числе организация интерфейсов ?

Нужен высокопроизводительный сортировщик деревьев для коммерческого алгоритма, которому Linux будет по DMA PCIe (2.0 - 3.0) сбрасывать большие массивы такого типа структур и забирать обратно. На борде будет стоять GDDR5 или Rambus DRAM + что-то менее производительное для DMA буффера и хранения промежуточных результатов... Как-то так...

 

Система еще не готова, ведется собственно рассчет архитектуры. Важно не просто реализовать сортировку, а сделать так, чтобы она на больших массивах данных работала быстрее, чем Core i7 и GPU CUDA :wacko:

 

ЗЫ. вы дали хедер класса, а где его тело ?

Прикрепил

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

Ok, спасибо ща посмотрю.

 

далеко ходить не надо сортировка чисел

 

 

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

Присоединяйтесь к обсуждению

Вы можете написать сейчас и зарегистрироваться позже. Если у вас есть аккаунт, авторизуйтесь, чтобы опубликовать от имени своего аккаунта.

Гость
Ответить в этой теме...

×   Вставлено с форматированием.   Вставить как обычный текст

  Разрешено использовать не более 75 эмодзи.

×   Ваша ссылка была автоматически встроена.   Отображать как обычную ссылку

×   Ваш предыдущий контент был восстановлен.   Очистить редактор

×   Вы не можете вставлять изображения напрямую. Загружайте или вставляйте изображения по ссылке.

×
×
  • Создать...