Jump to content

    
Almaz1988

"Прикрутить" распознавание русско-язычной речи на железке под управлением OpenWrt

Recommended Posts

Добрый день.

Имеется железка с процессором IMX6ULL на борту под управлением ОС OpenWrt.

На ней отлажено воспроизведение звука из аудио-файла в динамики, а также запись звука с микрофона в аудио-файл. Т.е. железо исправно, - задача чисто софтверная.

Необходимо решить задачу распознавания русско-язычной речи "в обе стороны": с динамиков на сервер и с сервера на микрофон с помощью какого-либо сервиса наподобие Amazon voice service либо иным способом. С нуля реализацию сервиса а-ля Яндекс Алиса или Amazon Alexa не потяну. Просьба откликаться, только если вы уже реализовывали подобные задачи на базе каких-то готовых открытых решений/сервисов.

В итоге должно получиться нечто подобное:

https://www.youtube.com/watch?v=uTyDqjG5o8s

Стоимость - 40к.

Отклики присылайте на almaz.khamidullin@m2m-tele.com

 

Edited by Almaz1988

Share this post


Link to post
Share on other sites

я так понимаю, что достаточно на гугль/яндекс отправлять аудио и получать расшифровку. 

на сахаре некий энтузиаст пару лет назад такую игрушку показывал. предполагаю что там бюджет был на 2 или 3 нолика меньше

я не особо в теме, вроде гугль яндекс деньги берут за этот сервис, может есть другие

 

Share this post


Link to post
Share on other sites
On 6/20/2020 at 10:20 PM, baumanets said:

Эта задача решена моим бизнес-компаньоном.

Готовы продать, только в сумме, как минимум, нолик потерялся.

Сделано было на базе STM32.

 

400 тыс. руб. за видео с одним единственным словом "СВЕТ"... Оторванность от реальности... Летайте поближе к земле.

Share this post


Link to post
Share on other sites
20.06.2020 в 22:20, baumanets сказал:

Эта задача решена моим бизнес-компаньоном.

Ролик ни о чём. Тепличные условия....

Где проверка реакции на любой другой похожий звук? Типа "бред", "Света", "светло" и т.п.

Где проверка реакции на разные голоса? Расстояние, эхо?

Где проверка работы на фоне шума (хотя-бы - на фоне работающего рядом телевизора/радио, текущей воды)?

Share this post


Link to post
Share on other sites

Чтобы для распознавания голоса использовать гугол, нужно иметь интернет-канал на железяке, причем, канал достаточно жирный…

Share this post


Link to post
Share on other sites
5 hours ago, baumanets said:

Задай вопрос автору на ютубе. Здесь он редко бывает.

Замечательный уровень тех. поддержки для продукта за 400к. Продаете за немаленькие деньги и даже не считаете нужным пригласить автора ответить на технические вопросы. Автор разработки вообще в курсе, что вы его продукт тут продаете?

Edited by Almaz1988

Share this post


Link to post
Share on other sites
28.06.2020 в 19:43, Almaz1988 сказал:

Замечательный уровень тех. поддержки для продукта за 400к. Продаете за немаленькие деньги и даже не считаете нужным пригласить автора ответить на технические вопросы. Автор разработки вообще в курсе, что вы его продукт тут продаете?

 

А зачем? Сначала надо отсеять жадных и неадекватных заказчиков. Потом с остальными вести дела.

Не готовы платить - товар не для вас, спокойно проходите мимо.

Share this post


Link to post
Share on other sites
9 часов назад, baumanets сказал:

А зачем? Сначала надо отсеять жадных и неадекватных заказчиков.

Эммм.

Я разместил заказ на форуме electronix, указал стоимость работ, специально сделал акцент на том, что бОльшую сумму не потяну.

Вы на него откликнулись с ходу запросив в десять раз больше. Причем даже разработка не ваша. Что вы продаете? Контактные данные разработчика? Кто из нас неадекватен?

Цитата

 

Потом с остальными вести дела.

 

Если нашлись желающие приобрести ваш продукт, то зачем у меня в ветке спамите?

Цитата

спокойно проходите мимо

Вы ничего не перепутали?)

Вы откликнулись в моей ветке.

Как бы вы ко мне пришли с предложением, не я к вам)

 

Это как прийти на встречу с потенциальным заказчиком к нему в офис, закинуть ноги на стол и закурив сигару сказать "если вас что-то не устраивает, спокойно проходите мимо")))

Ржака)

P.S.

Исполнителя на electronix конечно х.р найдешь, остается только угарать с местных )))

Каждый раз одно и то же, - на заказ сбегаются элитные разработчики и сходу просят 100500 баксов в секунду, игнорируя указанную стоимость заказа. Если в заказе указана N-ная сумма, на что вы рассчитываете, когда просите в X раз больше? Я уже молчу про то, что при этом пытаются впарить ардуино поделки. Уровень разработчиков - днищенский, -  90% толком гитом не умеют пользоваться, а гонору - вагон.

Снимайте корону когда идете на поклон к клиенту/заказчику/работодателю. Гонор в продажах не помогает ну никак. Если цель действительно что-то продать (товар/услугу/свое время), а не потешить свое ЧСВ.

Share this post


Link to post
Share on other sites
On 6/28/2020 at 7:36 PM, Eddy_Em said:

Чтобы для распознавания голоса использовать гугол, нужно иметь интернет-канал на железяке, причем, канал достаточно жирный…

да ладно, для голоса то?

Share this post


Link to post
Share on other sites

Работал с Google S2T, Deepgram и одним отечественным решением. Решение от Amazon, насколько я знаю, не поддерживает русский язык. Самое лучшее качество распознавания было у Google S2T. Единственный нюанс, это работа с ключами. Google выдаёт сертификат, на основании которого каждый час генерируются ключи. Ключи используются в запросах на распознавание и генерируются сервисом от Google. Библиотека для запроса ключей по сертификату закрыта, написана под .NET core. Для разработки нужны требования по задержкам. Большинство "распознавалок" работают в пакетном и потоковом режимах. Для пакетного режима нужно перекрытие фреймов, но работать с ним проще. Для повышения эффективности использования канала хорошо бы задействовать VAD. Ну и разбор ответов нетривиальный.

Share this post


Link to post
Share on other sites
On 6/28/2020 at 3:55 PM, sergey.ka said:

Что мешает использовать Гугл распознавание голоса? Работает быстро и точно. 

Отсутствие исполнителя.

 

Quote

Чтобы для распознавания голоса использовать гугол, нужно иметь интернет-канал на железяке, причем, канал достаточно жирный…

На железке есть Ethernet, есть динамики, есть микрофон.

Драйвера написаны. Железо исправно. 

 

Edited by Almaz1988

Share this post


Link to post
Share on other sites
40 minutes ago, Almaz1988 said:

На железке есть Ethernet, есть динамики, есть микрофон.

Драйвера написаны. Железо исправно. 

 

Подписку на Yandex.SpeechKit оплачиваете?

Share this post


Link to post
Share on other sites

Join the conversation

You can post now and register later. If you have an account, sign in now to post with your account.

Guest
Reply to this topic...

×   Pasted as rich text.   Paste as plain text instead

  Only 75 emoji are allowed.

×   Your link has been automatically embedded.   Display as a link instead

×   Your previous content has been restored.   Clear editor

×   You cannot paste images directly. Upload or insert images from URL.