Перейти к содержанию
    

Help! Алгорит выделения формант

Добрый день!

 

Вопрос к знатокам... так как мне совсем сложно в этой теме.... :'(

Задача : обработка речевого сигнала...для выделения получения формант (чтобы провести анализ полученных данных на основе заданных критериев, например, определение людей с некоторыми заболеваниями)

Сделано:

1. Описано схема устройства - микрофон - полосные фильтры - АЦП - Анализ данных

2.обоснован выбор кепстрального анализа

3. реализация вычисление кепстра ДПФ - Log - обратное ДПФ

 

В итоге с кепстра нужно выделить форманты с помощью некоторого алгоритма, вот тут у меня полный ступор... :wall:

Никакой инфы найти не могу... кроме книги : Рабинера - Цифровая обработка речевых сигналов (там непонятно описано)

 

Если, есть возможность скиньте ссылки на рускоязычные источники, с описанием алгоритма (блок-схемы)...

 

 

Спасибо заранее огромное. :yes:

 

Можно писать на [email protected]

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

Добрый день!

 

Вопрос к знатокам... так как мне совсем сложно в этой теме.... :'(

Задача : обработка речевого сигнала...для выделения получения формант (чтобы провести анализ полученных данных на основе заданных критериев, например, определение людей с некоторыми заболеваниями)

Сделано:

1. Описано схема устройства - микрофон - полосные фильтры - АЦП - Анализ данных

2.обоснован выбор кепстрального анализа

3. реализация вычисление кепстра ДПФ - Log - обратное ДПФ

 

В итоге с кепстра нужно выделить форманты с помощью некоторого алгоритма, вот тут у меня полный ступор... :wall:

Никакой инфы найти не могу... кроме книги : Рабинера - Цифровая обработка речевых сигналов (там непонятно описано)

 

Если, есть возможность скиньте ссылки на рускоязычные источники, с описанием алгоритма (блок-схемы)...

 

 

Спасибо заранее огромное. :yes:

 

Можно писать на [email protected]

 

Поделитесь ума заключениями насчет обоснования выбора кепстрального анализа,

тогда можно будет подискутировани на предмет выбора алгоритма обнаружения.

 

А информации на русском по данной тематике просто нет, Рабинер, Шефер еще пару японцев опубликовали

работу по этому поводу в 60-х, но там подход с аппроксимацией речи Гаусовым процессом, мне кажется тупиковым.

Работы все эти разумеется в оригинале.

 

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

Поделитесь ума заключениями насчет обоснования выбора кепстрального анализа,

тогда можно будет подискутировани на предмет выбора алгоритма обнаружения.

 

А информации на русском по данной тематике просто нет, Рабинер, Шефер еще пару японцев опубликовали

работу по этому поводу в 60-х, но там подход с аппроксимацией речи Гаусовым процессом, мне кажется тупиковым.

Работы все эти разумеется в оригинале.

 

Вы знаете, кепстральный анализ уже переиграли на обычный спектральный. А алгоритм определения формант применяем описанный ниже...

Но это мне кажется притянутым за уши, т.к. не учитывает допустим вариант с формантами буквы "И", когда вторая форманта в несколько раз больше первой...а не в 2. Сам шаг поиска формант...определяемый как равный первой форманте мне кажется не совсем верным....Непонятно как определить окно поиска формант (пока определяем как полшага назад и полшага вперед для предпологаемой форманнты).

 

Вообщем, может быть вы подскажите более простой-действенный способ определения формант?

Спектральный анализ не аксиома...

 

 

 

"Известно, что первая форманта (частота основного тона) лежит в промежутке от 50 Гц (у взрослого мужчины) до 300 Гц ( у детей и некоторых женщин). Кроме того известно, что амплитуда каждой последующей форманты ниже, чем предыдущей, а их частоты равны частоте основного тона умноженного на целое число (2 для F1, 3 для F2 и так далее).

Таким образом мы можем найти максимальное значение амплитуды сигнала на отрезке от 50 Гц до 300 Гц, после чего умножить эту частоту на 2, найти максимальное значение амплитуды в некоторой окрестности этой точки, проверить является ли она максимумом амплитуды в некоторой большей окрестности. Если это предположение верно, то мы нашли частоту второй форманты (F1). Если нет – второй форманты у сигнала нет.

Далее умножаем частоту основного тона на три и повторяем все вышеприведенные шаги для третьей форманты. Потом повторяем для всех остальных формант. Как правило, вычисляют от 4 до 6 формант."

 

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

Ну я так понимаю, Вы хотите просто установить факт наличия в сигнале некоторых составляющих.

 

Тогда лучше оптимальной фильтрации еще ничего не придумали, в книгах по аудиологии можно найти

форму формант во временной области и их состав в частотной области.

 

С точки зрения вычисления все сводится к свертке.

А признаком наличия искомого фрагмента будет пик корреляции.

 

 

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

"Известно, что первая форманта (частота основного тона)

Уже это неверно. Форманты и частота основного тона совершенно не связаны между собой по частоте.

 

 

Таким образом мы можем найти максимальное значение амплитуды сигнала на отрезке от 50 Гц до 300 Гц, после чего умножить эту частоту на 2, найти максимальное значение амплитуды в некоторой окрестности этой точки, проверить является ли она максимумом амплитуды в некоторой большей окрестности. Если это предположение верно, то мы нашли частоту второй форманты (F1). Если нет – второй форманты у сигнала нет. Далее умножаем частоту основного тона на три и повторяем все вышеприведенные шаги для третьей форманты. Потом повторяем для всех остальных формант. Как правило, вычисляют от 4 до 6 формант."

Таким образом вы найдёте не форманты, а гармоники сигнала.

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

Задача определения гармоник в спектре очень - очень популярна в среде людей, занимающихся сверхразрешением. Для подсчета числа гармоник наиболее часто используют критерий Акаике или MDL. По этому поводу смотрите книжку Марпла, глава, если не изменяет память, посвященная MUSIC'у. Ну а посчитав число гармоник, можно теми же MUSIC'ами, методами Прони, Монакова, Писаренко и т.д. (их там до *опы напридумано) вычислить точное положение этих гармоник.

 

Ну вот как-то так.

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

Присоединяйтесь к обсуждению

Вы можете написать сейчас и зарегистрироваться позже. Если у вас есть аккаунт, авторизуйтесь, чтобы опубликовать от имени своего аккаунта.

Гость
Ответить в этой теме...

×   Вставлено с форматированием.   Вставить как обычный текст

  Разрешено использовать не более 75 эмодзи.

×   Ваша ссылка была автоматически встроена.   Отображать как обычную ссылку

×   Ваш предыдущий контент был восстановлен.   Очистить редактор

×   Вы не можете вставлять изображения напрямую. Загружайте или вставляйте изображения по ссылке.

×
×
  • Создать...