Kluwer 0 20 февраля, 2011 Опубликовано 20 февраля, 2011 · Жалоба Нужен именно СИНТЕЗАТОР, т.е. текст заранее неизвестен, поэтому ориентироваться на словарь, наверное, неправильно. Если нужен ИМЕННО синтезатор, то здесь выход только один: так называемый "формантный синтезатор", которые часто использовались в доWinдовые времена. Он доходчиво описан в популярной книжке Кейтера "Компьютеры - синтезаторы речи" (я её еще в школе читал :). Берется база слогов (лучше, конечно, фонем, но это вряд ли возможно) далее эти слоги аналогично как в ЛПК-кодерах (тот же G.729 для примера) сегментируются на участки по признаку "гармоники-шум". Далее от озвученных участков берутся только частоты первых трех гармоник. На шумовых участках грубо оценивается спектр (по-сути тот же ЛПК (или АР, как кому нравиться) только с моделью очень низкого порядка). Эти данные и составляют базу. Размер её для русского языка будет смешным: что-то типа 20-30Кбайт. Ну и собственно дальше идет синтез слова по слогам. Если решать эту задачу совсем в лоб, то качество будет "упаси боже". Но, если с умом (имитировать коартикуляцию, переменную длительность слогов, оглушения и т.п.) - качество будет разумным, по-крайней мере, для каких-либо оповещателей. Цитата Поделиться сообщением Ссылка на сообщение Поделиться на другие сайты Поделиться
learning_avr32 0 20 февраля, 2011 Опубликовано 20 февраля, 2011 (изменено) · Жалоба ...Ну и собственно дальше идет синтез слова по слогам... Если бы все так было просто - давно бы уже сделали синтезатор хорошего качества хотя бы для PC. (Я прослушал примеры для Digalo, Festival, Alyona и т.д. Качество меня не устроило+геморрой со словарями и обучением - это нечто :cranky: ) ...качество будет разумным, по-крайней мере, для каких-либо оповещателей... Хочется книжки слушать :rolleyes: P.S. За книжку спасибо - поищу обязательно Изменено 20 февраля, 2011 пользователем forever_student Цитата Поделиться сообщением Ссылка на сообщение Поделиться на другие сайты Поделиться