На чем дешевле сделать голосовое управление?

Ответить

sigmaN 0

24 декабря, 2013

Опубликовано 24 декабря, 2013 · Жалоба

В общем тема тюнинга продолжается)

Идея замутить голосовое управление некоторыми функциями в автомобиле не покидает меня и нескольких единомышленников....

Изделие если и будет создаваться, то естественно с прицелом на продажу. Но тираж всё равно по любому будет не большим(читай единичным) т.к. бюджет, да и в принципе не очень понятна потребность в таких игрушках... Больше с этой игрушкой поигратся хочется уже на этапе её создания )))

В связи с этим вопрос: на чем делать распознавание голоса?

В принципе пока нашелся EASYVR и он вроде как сгодился бы, судя по описанию...

Недостатка 2

1. низкая гибкость решения

2. цена 65у.е. у нас в рознице. может есть дешевле, но пока быстрое гугление показало. в общем грубо можно считать 50$ цену, что всё равно не мало как мне пока кажется.

Вообще я рад любым трудностям и экспериментам) Если есть какой-нибудь свободный движок для этих дел то можем подумать и за эти деньги всунуть проц помощнее(а то и малинку целиком) и немного поупражняться с портированием (опыт портирования и оптимизации Speex на TI С2000 был, так что дело пойдет наверно веселее чем тогда в первый раз).

Цитата

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

uriy 5

25 декабря, 2013

Опубликовано 25 декабря, 2013 · Жалоба

Раз проц мощный можно это попробовать

http://cmusphinx.sourceforge.net/

Сам не пробовал, очень бы хотелось узнать ваши результаты.

Цитата

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

sigmaN 0

25 декабря, 2013

Опубликовано 25 декабря, 2013 · Жалоба

Тоже нагуглил уже. Покетсфинкс сишный говорят вполне сносно работает на малинке.

Единственное, что-то опрос клиентов показывает низкую заинтересованность в подобных пантах.... :(

Цитата

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

Tarbal 4

25 декабря, 2013

Опубликовано 25 декабря, 2013 · Жалоба

Сам не пробовал, но похоже Андроид все может.

Цитата

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

delaver 0

26 декабря, 2013

Опубликовано 26 декабря, 2013 · Жалоба

В общем тема тюнинга продолжается)

Если пофантазировать, можно разделить задачу на две составляющие, первая это набор распознавания первичный и создание базы, второй это просто распознавание по архиву сэмплов. То есть в режиме обучения распознавание делает мощный внешний комп, который делает полный анализ складывает образцы куда то в базу, а в рабочем режиме, уже не такой мощный проц просто сравнивает то, что произнесено с тем, что наработано в базе, по сути проц, несколько фильтров и программа сравнения.

Цитата

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

muravei 3

26 декабря, 2013

Опубликовано 26 декабря, 2013 · Жалоба

Гуглом

Цитата

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

delaver 0

26 декабря, 2013

Опубликовано 26 декабря, 2013 · Жалоба

Гуглом

Да точно, крутилось в уме, использовать мегатонны серверов гугла для сбора выборок на распознавание хороший вариант.

Цитата

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

muravei 3

26 декабря, 2013

Опубликовано 26 декабря, 2013 · Жалоба

Яндексе тоже что-то есть.

Цитата

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

sigmaN 0

26 декабря, 2013

Опубликовано 26 декабря, 2013 · Жалоба

Да нет, наверно всё-таки на постоянный онлайн надеяться не приходится....

Как ни странно люди особого интереса к теме не проявляют... Пока всё притормозили в общем.

Цитата

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

Stepanov 9

26 декабря, 2013

Опубликовано 26 декабря, 2013 · Жалоба

Не то, что не проявляют. Просто это проблемная тема, за последние 10 лет особых сдвигов нет. В некоторый автомобидях ставят штатную систему голосового управления. Практика этой темы такова. Вы можете рассчитывать в лючшем случае на 80% верно распознанных команд, это в лучших условиях когда вы в нормальном состоянии говорите четки и раздельно, ваш голос громче любых помех для микрофонов, когда сипользуется минимум два-три микрофона для формирования направленной диаграммы (чтоб пространство перед подголовником было в фокусе).

Цитата

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

Присоединяйтесь к обсуждению

Вы можете написать сейчас и зарегистрироваться позже. Если у вас есть аккаунт, авторизуйтесь, чтобы опубликовать от имени своего аккаунта.

К сожалению, ваш контент содержит запрещённые слова. Пожалуйста, отредактируйте контент, чтобы удалить выделенные ниже слова.

Ответить в этой теме...

× Вставлено с форматированием. Вставить как обычный текст

Разрешено использовать не более 75 эмодзи.

× Ваша ссылка была автоматически встроена. Отображать как обычную ссылку

× Ваш предыдущий контент был восстановлен. Очистить редактор

× Вы не можете вставлять изображения напрямую. Загружайте или вставляйте изображения по ссылке.

Указать URL изображения

Подписчики 0

sigmaN 0

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

uriy 5

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

sigmaN 0

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

Tarbal 4

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

delaver 0

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

muravei 3

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

delaver 0

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

muravei 3

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

sigmaN 0

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

Stepanov 9

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

Присоединяйтесь к обсуждению

Обзор

Активность