Организация голосового управления

Ответить

syoma 1

11 января, 2016

Опубликовано 11 января, 2016 · Жалоба

Привет,

Не нашел подходящего раздела, поэтому попробую здесь.

Задача собственно банальная - допустим человек находится в комнате и говорит вслух. Нужно выделять команды из речи, например по кодовому слову, распознавать их и выдавать, допустим в виде печатного текста или URL запроса. Язык - русский. Люди могут быть разные. Команды будут запрограммированы заранее.

Вопрос - это на сегодняшний момент возможно на стандартном оборудовании/сервисах с минимальным программированием? Как это организовывается? Подскажите, кто уже реализовывал.

Собственно интересует более конкретно:

- Какова общая концепция - что ставится, как распознается голос, сервер, локально, через интернет?

- Если через интернет - какие сервисы обычно используются для распознавания - Google, Siri другие? Если локально, какие программы, платные, бесплатные, на какой платформе?

- Что с оборудованием - ставятся микрофоны в комнате, или делается через телефоны/планшеты? Как далеко можно стоять от микровонов? Нужно конкретно куда-то громко говорить или можно сделать так, что команда будет услышана, в каком бы месте комнаты она не была произнесена? Даже тихо? Как синхронизируются микрофоны?

- Возможно ли организовать работу системы так, чтобы распознавание начиналось после того, как услышано кодовое слово - то есть без необходимости нажимать на специальные кнопки?

- Обучение - с командами понятно. Но нужно ли обучать на тембр, произношение и голос конкретного человека? Если да, насколько сложно.

- Насколько вообще надежно распознавание и какая может получиться общая задержка?

Цитата

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

adnega 10

11 января, 2016

Опубликовано 11 января, 2016 · Жалоба

Была такая статейка.

Цитата

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

AlexandrY 2

11 января, 2016

Опубликовано 11 января, 2016 · Жалоба

- Насколько вообще надежно распознавание и какая может получиться общая задержка?

Тренируйтесь - https://www.google.com/intl/en/chrome/demos/speech.html

Цитата

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

uriy 4

11 января, 2016

Опубликовано 11 января, 2016 · Жалоба

вот для локального распознавания http://cmusphinx.sourceforge.net/ но я не пробовал

Цитата

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

syoma 1

19 января, 2016

Опубликовано 19 января, 2016 · Жалоба

Поискал в инете, вроде как неплохое решение получается с "Окей, Гугл". На планшете включается эта опция, затем ставятся Tasker + Autovoice. И в таскере настраиваются команды, например запуск запросов к серверу через REST API. Можно вместо REST API MQTT PUBLISHER плугин подключить.

Должно получаться примерно так:

https://youtu.be/P3QkGh8L2Mg

Русский язык проверил - распознавание работает хорошо. Единственное, что команду "ОК, Гугл" планшет запоминает, чтобы быстро переходить к распознаванию и это может не очень хорошо работать, если команду будут давать разные люди. Но есть пара приложений, которые настраиваются на любое слово - надо будет попробовать.

По поводу дальности микрофона - надо поэкспериментировать с bluetooth гарнитурами - вроде есть микрофоны для телеконференций, которые очень хорошо фильтруют все шумы и усиливают голос. А так мой единственный пока андроидный планшет распознает с 2-х метров, но надо громко говорить.

Цитата

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

Присоединяйтесь к обсуждению

Вы можете написать сейчас и зарегистрироваться позже. Если у вас есть аккаунт, авторизуйтесь, чтобы опубликовать от имени своего аккаунта.

Ответить в этой теме...

× Вставлено с форматированием. Вставить как обычный текст

Разрешено использовать не более 75 эмодзи.

× Ваша ссылка была автоматически встроена. Отображать как обычную ссылку

× Ваш предыдущий контент был восстановлен. Очистить редактор

× Вы не можете вставлять изображения напрямую. Загружайте или вставляйте изображения по ссылке.

Указать URL изображения

Подписчики 0

Войти

syoma 1

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

adnega 10

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

AlexandrY 2

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

uriy 4

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

syoma 1

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

Присоединяйтесь к обсуждению

Обзор

Активность