Перейти к содержанию
    

На чем дешевле сделать голосовое управление?

В общем тема тюнинга продолжается)

Идея замутить голосовое управление некоторыми функциями в автомобиле не покидает меня и нескольких единомышленников....

 

Изделие если и будет создаваться, то естественно с прицелом на продажу. Но тираж всё равно по любому будет не большим(читай единичным) т.к. бюджет, да и в принципе не очень понятна потребность в таких игрушках... Больше с этой игрушкой поигратся хочется уже на этапе её создания )))

 

В связи с этим вопрос: на чем делать распознавание голоса?

В принципе пока нашелся EASYVR и он вроде как сгодился бы, судя по описанию...

Недостатка 2

1. низкая гибкость решения

2. цена 65у.е. у нас в рознице. может есть дешевле, но пока быстрое гугление показало. в общем грубо можно считать 50$ цену, что всё равно не мало как мне пока кажется.

 

Вообще я рад любым трудностям и экспериментам) Если есть какой-нибудь свободный движок для этих дел то можем подумать и за эти деньги всунуть проц помощнее(а то и малинку целиком) и немного поупражняться с портированием (опыт портирования и оптимизации Speex на TI С2000 был, так что дело пойдет наверно веселее чем тогда в первый раз).

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

Раз проц мощный можно это попробовать

http://cmusphinx.sourceforge.net/

Сам не пробовал, очень бы хотелось узнать ваши результаты.

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

Тоже нагуглил уже. Покетсфинкс сишный говорят вполне сносно работает на малинке.

Единственное, что-то опрос клиентов показывает низкую заинтересованность в подобных пантах.... :(

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

В общем тема тюнинга продолжается)

 

Если пофантазировать, можно разделить задачу на две составляющие, первая это набор распознавания первичный и создание базы, второй это просто распознавание по архиву сэмплов. То есть в режиме обучения распознавание делает мощный внешний комп, который делает полный анализ складывает образцы куда то в базу, а в рабочем режиме, уже не такой мощный проц просто сравнивает то, что произнесено с тем, что наработано в базе, по сути проц, несколько фильтров и программа сравнения.

 

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

Да точно, крутилось в уме, использовать мегатонны серверов гугла для сбора выборок на распознавание хороший вариант.

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

Да нет, наверно всё-таки на постоянный онлайн надеяться не приходится....

Как ни странно люди особого интереса к теме не проявляют... Пока всё притормозили в общем.

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

Не то, что не проявляют. Просто это проблемная тема, за последние 10 лет особых сдвигов нет. В некоторый автомобидях ставят штатную систему голосового управления. Практика этой темы такова. Вы можете рассчитывать в лючшем случае на 80% верно распознанных команд, это в лучших условиях когда вы в нормальном состоянии говорите четки и раздельно, ваш голос громче любых помех для микрофонов, когда сипользуется минимум два-три микрофона для формирования направленной диаграммы (чтоб пространство перед подголовником было в фокусе).

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

Присоединяйтесь к обсуждению

Вы можете написать сейчас и зарегистрироваться позже. Если у вас есть аккаунт, авторизуйтесь, чтобы опубликовать от имени своего аккаунта.

Гость
К сожалению, ваш контент содержит запрещённые слова. Пожалуйста, отредактируйте контент, чтобы удалить выделенные ниже слова.
Ответить в этой теме...

×   Вставлено с форматированием.   Вставить как обычный текст

  Разрешено использовать не более 75 эмодзи.

×   Ваша ссылка была автоматически встроена.   Отображать как обычную ссылку

×   Ваш предыдущий контент был восстановлен.   Очистить редактор

×   Вы не можете вставлять изображения напрямую. Загружайте или вставляйте изображения по ссылке.

×
×
  • Создать...