Перейти к содержанию
    

"Прикрутить" распознавание русско-язычной речи на железке под управлением OpenWrt

Добрый день.

Имеется железка с процессором IMX6ULL на борту под управлением ОС OpenWrt.

На ней отлажено воспроизведение звука из аудио-файла в динамики, а также запись звука с микрофона в аудио-файл. Т.е. железо исправно, - задача чисто софтверная.

Необходимо решить задачу распознавания русско-язычной речи "в обе стороны": с динамиков на сервер и с сервера на микрофон с помощью какого-либо сервиса наподобие Amazon voice service либо иным способом. С нуля реализацию сервиса а-ля Яндекс Алиса или Amazon Alexa не потяну. Просьба откликаться, только если вы уже реализовывали подобные задачи на базе каких-то готовых открытых решений/сервисов.

В итоге должно получиться нечто подобное:

https://www.youtube.com/watch?v=uTyDqjG5o8s

Стоимость - 40к.

Отклики присылайте на [email protected]

 

Изменено пользователем Almaz1988

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

Эта задача решена моим бизнес-компаньоном.

Готовы продать, только в сумме, как минимум, нолик потерялся.

Сделано было на базе STM32.

 

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

я так понимаю, что достаточно на гугль/яндекс отправлять аудио и получать расшифровку. 

на сахаре некий энтузиаст пару лет назад такую игрушку показывал. предполагаю что там бюджет был на 2 или 3 нолика меньше

я не особо в теме, вроде гугль яндекс деньги берут за этот сервис, может есть другие

 

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

On 6/20/2020 at 10:20 PM, baumanets said:

Эта задача решена моим бизнес-компаньоном.

Готовы продать, только в сумме, как минимум, нолик потерялся.

Сделано было на базе STM32.

 

400 тыс. руб. за видео с одним единственным словом "СВЕТ"... Оторванность от реальности... Летайте поближе к земле.

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

20.06.2020 в 22:20, baumanets сказал:

Эта задача решена моим бизнес-компаньоном.

Ролик ни о чём. Тепличные условия....

Где проверка реакции на любой другой похожий звук? Типа "бред", "Света", "светло" и т.п.

Где проверка реакции на разные голоса? Расстояние, эхо?

Где проверка работы на фоне шума (хотя-бы - на фоне работающего рядом телевизора/радио, текущей воды)?

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

Что мешает использовать Гугл распознавание голоса? Работает быстро и точно. 

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

Чтобы для распознавания голоса использовать гугол, нужно иметь интернет-канал на железяке, причем, канал достаточно жирный…

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

5 hours ago, baumanets said:

Задай вопрос автору на ютубе. Здесь он редко бывает.

Замечательный уровень тех. поддержки для продукта за 400к. Продаете за немаленькие деньги и даже не считаете нужным пригласить автора ответить на технические вопросы. Автор разработки вообще в курсе, что вы его продукт тут продаете?

Изменено пользователем Almaz1988

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

28.06.2020 в 19:43, Almaz1988 сказал:

Замечательный уровень тех. поддержки для продукта за 400к. Продаете за немаленькие деньги и даже не считаете нужным пригласить автора ответить на технические вопросы. Автор разработки вообще в курсе, что вы его продукт тут продаете?

 

А зачем? Сначала надо отсеять жадных и неадекватных заказчиков. Потом с остальными вести дела.

Не готовы платить - товар не для вас, спокойно проходите мимо.

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

9 часов назад, baumanets сказал:

А зачем? Сначала надо отсеять жадных и неадекватных заказчиков.

Эммм.

Я разместил заказ на форуме electronix, указал стоимость работ, специально сделал акцент на том, что бОльшую сумму не потяну.

Вы на него откликнулись с ходу запросив в десять раз больше. Причем даже разработка не ваша. Что вы продаете? Контактные данные разработчика? Кто из нас неадекватен?

Цитата

 

Потом с остальными вести дела.

 

Если нашлись желающие приобрести ваш продукт, то зачем у меня в ветке спамите?

Цитата

спокойно проходите мимо

Вы ничего не перепутали?)

Вы откликнулись в моей ветке.

Как бы вы ко мне пришли с предложением, не я к вам)

 

Это как прийти на встречу с потенциальным заказчиком к нему в офис, закинуть ноги на стол и закурив сигару сказать "если вас что-то не устраивает, спокойно проходите мимо")))

Ржака)

P.S.

Исполнителя на electronix конечно х.р найдешь, остается только угарать с местных )))

Каждый раз одно и то же, - на заказ сбегаются элитные разработчики и сходу просят 100500 баксов в секунду, игнорируя указанную стоимость заказа. Если в заказе указана N-ная сумма, на что вы рассчитываете, когда просите в X раз больше? Я уже молчу про то, что при этом пытаются впарить ардуино поделки. Уровень разработчиков - днищенский, -  90% толком гитом не умеют пользоваться, а гонору - вагон.

Снимайте корону когда идете на поклон к клиенту/заказчику/работодателю. Гонор в продажах не помогает ну никак. Если цель действительно что-то продать (товар/услугу/свое время), а не потешить свое ЧСВ.

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

On 6/28/2020 at 7:36 PM, Eddy_Em said:

Чтобы для распознавания голоса использовать гугол, нужно иметь интернет-канал на железяке, причем, канал достаточно жирный…

да ладно, для голоса то?

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

Работал с Google S2T, Deepgram и одним отечественным решением. Решение от Amazon, насколько я знаю, не поддерживает русский язык. Самое лучшее качество распознавания было у Google S2T. Единственный нюанс, это работа с ключами. Google выдаёт сертификат, на основании которого каждый час генерируются ключи. Ключи используются в запросах на распознавание и генерируются сервисом от Google. Библиотека для запроса ключей по сертификату закрыта, написана под .NET core. Для разработки нужны требования по задержкам. Большинство "распознавалок" работают в пакетном и потоковом режимах. Для пакетного режима нужно перекрытие фреймов, но работать с ним проще. Для повышения эффективности использования канала хорошо бы задействовать VAD. Ну и разбор ответов нетривиальный.

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

On 6/28/2020 at 3:55 PM, sergey.ka said:

Что мешает использовать Гугл распознавание голоса? Работает быстро и точно. 

Отсутствие исполнителя.

 

Quote

Чтобы для распознавания голоса использовать гугол, нужно иметь интернет-канал на железяке, причем, канал достаточно жирный…

На железке есть Ethernet, есть динамики, есть микрофон.

Драйвера написаны. Железо исправно. 

 

Изменено пользователем Almaz1988

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

40 minutes ago, Almaz1988 said:

На железке есть Ethernet, есть динамики, есть микрофон.

Драйвера написаны. Железо исправно. 

 

Подписку на Yandex.SpeechKit оплачиваете?

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

Присоединяйтесь к обсуждению

Вы можете написать сейчас и зарегистрироваться позже. Если у вас есть аккаунт, авторизуйтесь, чтобы опубликовать от имени своего аккаунта.

Гость
Ответить в этой теме...

×   Вставлено с форматированием.   Вставить как обычный текст

  Разрешено использовать не более 75 эмодзи.

×   Ваша ссылка была автоматически встроена.   Отображать как обычную ссылку

×   Ваш предыдущий контент был восстановлен.   Очистить редактор

×   Вы не можете вставлять изображения напрямую. Загружайте или вставляйте изображения по ссылке.

×
×
  • Создать...