Перейти к содержанию
    

Прекрасная возможность для развития индустрии FPGA

Вашу бы энергию да в мирных целях. Даже алгоритм привёл, а вы ругаться.

Увеличивая мощность двигателя машины, которая везет Вас в неправильном направлении, Вы не попадете в желанный пункт назначения, не так ли ?

 

В этом топике ведь нет никого, кто нуждался бы, не так ли ?

Из инженерии плисовики практически самые высокооплачиваемые, не так ли ?

 

Вашу бы энергию, да в мирных целях (((

Я рад, что образование хотя бы не позволяет вам разрабатывать наркотики.

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

Вот вам пара тугриков - алгоритм и ожидаемый доход. Конвейер теоретически должен поместиться в 50000 слайсов 1 или 2 раза на частоте 500 МГц.

 

nist5

NIST5

 

 

tribus

tribus

 

Тугрик живёт несколько месяцев, потом дохнет. Если есть настроение, сделайте не хуже, чем означено выше, я знаю, куда это деть.

 

я увидел перечисление следующих алгоритмов:

 

nist5:

blake512

groestl512

jh512

keccak512

skein512

 

 

tribus:

jh512

keccak512

echo512

 

- видимо у крипто-инвенторов совсем фантазия закончилась: всё вариации на тему Х11 с цепочечным включением кандидатов на SHA3

1 слайс в вашей терминологии - это LUT+FF или 4х(LUT+FF) ?

и что значит сделать "не хуже"? Есть бенчмарк этого кода на GPU?

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

я увидел перечисление следующих алгоритмов:

 

nist5:

blake512

groestl512

jh512

keccak512

skein512

 

 

tribus:

jh512

keccak512

echo512

 

- видимо у крипто-инвенторов совсем фантазия закончилась: всё вариации на тему Х11 с цепочечным включением кандидатов на SHA3

1 слайс в вашей терминологии - это LUT+FF или 4х(LUT+FF) ?

и что значит сделать "не хуже"? Есть бенчмарк этого кода на GPU?

 

 

На 1080ti nist5 около 90 MH/s, tribus около 110 MH/s, видимо, с разгоном.

Для ПЛИС это результат так себе, особенно для полноcтью развёрнутого конвейера. На 50000 слайсов я прикидываю где-то 1-2 таких конвейера с частотой около 400-500 МГц, т.е. 5-10 раз быстрее.

 

Слайс - 4 LUT6 и 8 триггеров, см. Xilinx Kintex.

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

На 50000 слайсов я прикидываю где-то 1-2 таких конвейера с частотой около 400-500 МГц, т.е. 5-10 раз быстрее.

А на чем основан столь оптимистичный прогноз? У той же фирмы cast-inc хеш на Kintex® Ultrascale работает на частоте 250 МГц, а у вас Kintex и почему-то, вдруг, должен заработать на частоте 500 МГц. Или вы уже проверили всё это в железе?

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

А на чем основан столь оптимистичный прогноз? У той же фирмы cast-inc хеш на Kintex® Ultrascale работает на частоте 250 МГц, а у вас Kintex и почему-то, вдруг, должен заработать на частоте 500 МГц. Или вы уже проверили всё это в железе?

 

Кое-что похожее я проверил.

 

А вообще 250 МГц для Ultrascale это крайне маловато, разве нет?

Здесь не частота под вопросом, а скорее размер ядра, т.е. слайсы.

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

А вообще 250 МГц для Ultrascale это крайне маловато, разве нет?

Так это зависит от алгоритма. FFT на Kintex UltraScale работает на 450 МГц, причем, это на Speed Grade = 1.

 

Почему SHA-3 у cast-inc работает на 250 МГц мне не известно, но возможно, это особенности самого SHA-3.

 

Но сомнительно, что вы сможете улучшить их результат. Они, вроде как, занимаются этим уже достаточно давно, так что у них довольно серьезный бэкграунд.

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

Так это зависит от алгоритма. FFT на Kintex UltraScale работает на 450 МГц, причем, это на Speed Grade = 1.

 

Почему SHA-3 у cast-inc работает на 250 МГц мне не известно, но возможно, это особенности самого SHA-3.

 

Но сомнительно, что вы сможете улучшить их результат. Они, вроде как, занимаются этим уже достаточно давно, так что у них довольно серьезный бэкграунд.

 

В Англии ружья кирпичом не чистят...

 

Sample Implementation Results

...

...

Note that these sample implementation figures do not represent the highest speed or smallest area possible for the core

 

 

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

Почему SHA-3 у cast-inc работает на 250 МГц мне не известно, но возможно, это особенности самого SHA-3.

Тоже могу заметить что IP от cast-inc - не догма или образчик вылизывания перфоманса.

К SHA-3 от cast-inc я бы относился как к некоей референсной реализации.

Думаю врядли они делают что-то отличное от канонической реализации (перенесённой с референсного Си), а ведь именно выбор микроархитектуры (unrolled-2. quasi-pipelined, etc) может сильно заимпактить перфоманс в терминах Т/А (производительность/площадь)

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

по 2

из википедии знаю, что алгоритм не меняется, просто увеличивается количество вариантов, которые нужно перебрать, а алгоритм остается - ну тот же биткоин как был SHA-256, так и остается

то есть в "гипотетическом АЗИКе" нужно только маску менять, в смысле загружать значение в регистр

Так и есть, ядро double sha-256 не меняется его только и разумно в асике делать, а вот подносчик снарядов для

такого ядра должен быть программируемый проц или плиска.

 

Так развернутый конвейер - не панацея,

ни один асик-верндор майнеров (не берем в расчёт обанкротившихся) не делает развернутый конвейер.

а почему такая уверенность?

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

а почему такая уверенность?

есть подтвержденная информация как минимум по одному асик-вендору, если мы говорим про адгоритм sha256

..собственно как и обоснование почему выбрана folded-реализация

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

есть подтвержденная информация как минимум по одному асик-вендору, если мы говорим про адгоритм sha256

..собственно как и обоснование почему выбрана folded-реализация

 

Небось отсюда дёргают, вот и folded

ATHENa

 

Для ПЛИС конвейеры слишком крупные, конвейеры по 50000-100000 LUT6.

 

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

Из за технологии динамического интерконнекта FPGA по скорости работы медленнее от AISC на порядок.

Приблизительно на столько же меньше и плотность элементов на единицу площади.

То есть как минимум в 100 раз реализация алгоритма на FPGA будет менее эффективна чем на ASIC. (в расчете на чип) А если сюда прибавить повышенное потребление и существенно выше стоимость производства чипа FPGA чем ASIC возникнет вопрос - так кому будет выгода от таких чипов? :cranky:

Специализация же FPGA для узко заточенных функций (hard-IP !!!) цену чипа сильно не снизит а и так узкий рынок сбыта еще и уменьшит.

Давал когда-то ссылку на статью, в которой говорилось о 6-кратном превосходстве. Не думаю, что речь может идти о порядках. Речь идет о сравнении ПЛИС и ASIC, изготовленных по одному тех.процессу.

 

Цену ПЛИС я бы не стал считать. То есть все эти перечисленные hard-ip блоки имхо ничего не стоят. Они уже разработаны. Доля их стоимости в толстых плисинах сильно падает. Поправьте, если не прав, но для майнинга нужны чипы пожирнее.

 

Цена ПЛИС вторична еще и из-за того преимущества, что даже если она в 10 раз уступает майнеру на ASIC, окупив однажды, далее, меняя алгоритмы (понятно, что это нетривиальная задача), можно зарабатывать на майнинге. С ASIC так не выйдет из-за негибкости.

 

Это только мое умозрительное имхо, на истину не претендую.

 

Думаю врядли они делают что-то отличное от канонической реализации

К сути Вами написанного это не относится, но тем не менее. У меня вообще сомнения, что они что-то делают. По-моему, они просто продают ядра.

H.264, MJPEG у них от Alma Tech.

Изменено пользователем x736C

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

Поправьте, если не прав, но для майнинга нужны чипы пожирнее.

 

Ультражирный чип желателен >1 млн LUT6. Тогда конвейер разворачивается. Но где ж его добыть, этот чип.

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

Присоединяйтесь к обсуждению

Вы можете написать сейчас и зарегистрироваться позже. Если у вас есть аккаунт, авторизуйтесь, чтобы опубликовать от имени своего аккаунта.

Гость
Ответить в этой теме...

×   Вставлено с форматированием.   Вставить как обычный текст

  Разрешено использовать не более 75 эмодзи.

×   Ваша ссылка была автоматически встроена.   Отображать как обычную ссылку

×   Ваш предыдущий контент был восстановлен.   Очистить редактор

×   Вы не можете вставлять изображения напрямую. Загружайте или вставляйте изображения по ссылке.

×
×
  • Создать...