Перейти к содержанию
    

Offline распознавание речи (команд)

Offline распознавание речи (команд)

 

Voice Recognition Robotic Car

 

(Google перевод)

 

В начале нашего проекта, мы поставили перед собой цель признать пять слов, в конце проекта мы получили пять слов, чтобы быть признанным. Тем не менее наши пять слов нужно быть перпендикулярны друг другу, потому что наши фильтры не давали достаточно высокое разрешение и неточность в расчетах отпечатков пальцев в связи с использованием точки исправления арифметических операций сделал функцию поиска, чтобы быть подвержен ошибкам. В результате, мы должны были выбрать различные разные слова, которые звучат друг от друга. Если мы должны были сделать это еще раз, вместо того, чтобы пытаться использовать евклидово расстояние формулу, чтобы соответствовать слова, которые мы хотели бы попробовать сделать выполнить корреляцию двух отпечатков пальцев. Корреляция менее чувствителен к разности амплитуд и является лучшим способом выявления закономерностей между двумя объектами. Если бы мы имели более быстрый чип процесса, мы могли бы модифицирована наш алгоритм для добавления дополнительных фильтров, выполнять преобразование Фурье, или арифметики с плавающей точкой для того, чтобы улучшить наши результаты.

 

Кому-то под силу этот проект перевести с AVR MEGA32 на STM32F030 с предложенными улучшениями?

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

Кому-то под силу этот проект перевести с AVR MEGA32 на STM32F030 с предложенными улучшениями?

 

ИМХО. думаю тут не все так просто, или эти умельцы и сами бы смогли портировать проект на быстрый камень, сейчас тут трудностей нет, а вот написать хорошую математику - это уже совсем другая история.

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

Я бы постеснялся назвать это распознаванием речи :wacko:

 

The program was able to recognize five words, but sometimes it would become confused and match the incorrect word if the word that was spoken varied too much from the word stored in the dictionary. As a rough estimate the program recognized the correct word about 70% of the time a valid word was spoken. The program achieved success using Chirag’s voice, and with sufficient practice a person could say the same word with a small enough variation for the program to recognize the spoken word most of the time. For the general person though the recognition program would have a much lower percentage of success. Also the words in the dictionary are words spoken by only one person. If someone else said the same words it is unlikely the program would recognize the correct word most of the time, if at all.

Ты говоришь "тормози!", а оно жмёт на газ :biggrin:

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

На самом деле всю работу сделал тот грустный парень в зеленой майке на заднем плане :-D

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

Присоединяйтесь к обсуждению

Вы можете написать сейчас и зарегистрироваться позже. Если у вас есть аккаунт, авторизуйтесь, чтобы опубликовать от имени своего аккаунта.

Гость
Ответить в этой теме...

×   Вставлено с форматированием.   Вставить как обычный текст

  Разрешено использовать не более 75 эмодзи.

×   Ваша ссылка была автоматически встроена.   Отображать как обычную ссылку

×   Ваш предыдущий контент был восстановлен.   Очистить редактор

×   Вы не можете вставлять изображения напрямую. Загружайте или вставляйте изображения по ссылке.

×
×
  • Создать...