Перейти к содержанию
    

Переключение голосом

Коллеги, подскажите пожалуйста, какие особенности спектра человеческого голоса (преимущественно мужского) можно использовать для надежного переключения системы связи (радио, акустической) в режим передачи. Ссылки на где почитать/подсмотреть особенно интересны...

Спасибо.

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

форманта, вокодер, формантный фильтр.

(Это в основном для синтеза. Для "анализа" - читать в обратную сторону)

пара-тройка полосовых фильтров (аналоговых или цифровых)

 

 

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

Речь о VOX ? Если прием не громкоговорящий, то переключать вполне можно по факту наличия хоть какого-то сигнала больше порога и длительностью больше заданной.

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

11 minutes ago, rx3apf said:

Речь о VOX ? Если прием не громкоговорящий, то переключать вполне можно по факту наличия хоть какого-то сигнала больше порога и длительностью больше заданной.

Очевидно, у ТС "сложная акустическая обстановка" с присутствием собаки, детей, тещи - и обычный VOX будет работать неправильно :)

 

 

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

Трактовать исходный вопрос можно по-разному, а телепаты, как назло, опять в отпуске... Если просто по уровню, то решается элементарно хоть аналоговыми методами, хоть примитивно программно. Иначе - совсем другой подход, с совершенно другими затратами.

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

Есть проблемы с VOX у радиостанций в условиях ветра. Так что простой метод по уровню не одобряю. 

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

15 minutes ago, k155la3 said:

Очевидно, у ТС "сложная акустическая обстановка" с присутствием собаки, детей, тещи

Акустическая обстановка осложняется замкнутым объемом, близко расположенным микрофоном и возможным (весьма) интенсивным дыханием.

 

20 minutes ago, rx3apf said:

Трактовать исходный вопрос можно по-разному

Как и большинство вопросов...

 

21 minutes ago, rx3apf said:

Если просто по уровню, то решается элементарно хоть аналоговыми методами, хоть примитивно программно.

Если бы было просто, я бы не спрашивал.

 

22 minutes ago, rx3apf said:

Иначе - совсем другой подход, с совершенно другими затратами

Затраты не вопрос... Вопрос в решении с минимальной долей эмпирики.

Но все равно спасибо...

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

Я бы оцифровал речь и помехи, и посмотрел бы, как это выглядит "вживую", для конкретных условий. Можно ожидать, что дыхание, ветер - дадут подъем высокочастотных составляющих, а речь, наоборот, даст импульсные выброс в нижней части спектра.

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

1 hour ago, Axel said:

Акустическая обстановка осложняется замкнутым объемом, близко расположенным микрофоном и возможным (весьма) интенсивным дыханием.

? шлем ? От дыхания можно "отстроится" если использовать ларингофон. Если микрофон - то шум будет сложно отличать от шипящих звуков в речи.

Нужен VOX с линией задержки (памятью), тогда начало фразы не будет "проглатываться". Иначе придется "акать" :)

А вообще, смотрите по радиолюбительским сайтам "VOX". 

Также см. в области мобильной связи, кодеки. Там тоже определяется, когда абонент молчит (хотя акуст. шумы есть) и этот "шум" не передается по каналу связи.

(это проявляется в том, что иногда, после длительного монолога, мы переспрашиваем абонента если он молчит, "ты здесь ?", тк не слышим акуст.шумы со стороны абонента)

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

6 hours ago, k155la3 said:

шлем ?

Типа...

 

6 hours ago, k155la3 said:

Если микрофон - то шум будет сложно отличать от шипящих звуков в речи

Микрофон...

 

6 hours ago, k155la3 said:

Нужен VOX с линией задержки

Хорошо бы, но не компонуется с эхоподавлением. За наводку на связные кодеки спасибо - попробую чего-нибудь нарыть

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

Quote

VAD = Voice Activity Detection, а также Silence Suppression

(wiki)

смотрите лучше в англоязычной сети

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

7 hours ago, k155la3 said:

VAD = Voice Activity Detection

Вроде в тему. Спасибо. Кое-что нарыл на GitHub. Выглядит перспективно...

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

On 2/4/2019 at 5:39 AM, Axel said:

Вроде в тему.

 В результате: удалось скрестить ST-шную аудио либу с libvad (фрагмент webrtcvad). Работает вполне нормально. Для полного счастья хотелось бы сузить анализируемый диапазон частот, но как манипулировать ейными фильтрами - пока не разобрался. Может кто-нибудь знает?

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

Присоединяйтесь к обсуждению

Вы можете написать сейчас и зарегистрироваться позже. Если у вас есть аккаунт, авторизуйтесь, чтобы опубликовать от имени своего аккаунта.

Гость
К сожалению, ваш контент содержит запрещённые слова. Пожалуйста, отредактируйте контент, чтобы удалить выделенные ниже слова.
Ответить в этой теме...

×   Вставлено с форматированием.   Вставить как обычный текст

  Разрешено использовать не более 75 эмодзи.

×   Ваша ссылка была автоматически встроена.   Отображать как обычную ссылку

×   Ваш предыдущий контент был восстановлен.   Очистить редактор

×   Вы не можете вставлять изображения напрямую. Загружайте или вставляйте изображения по ссылке.

×
×
  • Создать...