Перейти к содержанию
    

Как сделать "говорилку"?

чем конвертировать *.WAV - файл в бинарник с массивом чисел, желательно, с нормированием к диапазону 0 - 255.

Вэйв это и есть бинарник с массивом чисел, а для уменьшения диапазона , думаю, подойдет любой звуковой редактор.

Кстати, тут никто не предлагал однобитовый звук , типа упрощенного дельта-сигма.

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

Подскажите, пожалуйста, чем конвертировать *.WAV - файл в бинарник с массивом чисел, желательно, с нормированием к диапазону 0 - 255.

SoundForge

лет 15 назад нужно было получить то же самое. Конвертил в 8бит/8кГц, а потом сохранял в RAW - вот и бинарник в чистом виде

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

Вот здесь есть программка для переделки wav в бинарник или массив шестнадцатеричных чисел, буду ее пробовать: http://www.imeda.nm.ru/

Вэйв это и есть бинарник с массивом чисел, а для уменьшения диапазона , думаю, подойдет любой звуковой редактор.

Кстати, тут никто не предлагал однобитовый звук , типа упрощенного дельта-сигма.

Да, но формат файла имеет свои накладные расходы - текстовая информация вначале. Не хотелось бы вручную редактировать или самому писать программу - время дорого.

Тут не просто нужно уменьшить диапазон. wav содержит отрицательные значения, для наших целей все значения должны быть в диапазоне 0-255.

Однобитовый звук? Не слышал, сейчас почитаю.

 

SoundForge

лет 15 назад нужно было получить то же самое. Конвертил в 8бит/8кГц, а потом сохранял в RAW - вот и бинарник в чистом виде

Спасибо! Но, к сожалению, корпоративная политика запрещает работать с нелицензионным (крякнутым) ПО.

Изменено пользователем Misile_Inc

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

Вэйв это и есть бинарник с массивом чисел,

нет, это контейнер с заголовком

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

Про дельта-модуляцию(ДМ): ДМ с двойным интегрированием лучше для голоса подходит, чем линейная. Там можно частоту дискретизации снизить килогерц до 40.

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

Про дельта-модуляцию(ДМ): ДМ с двойным интегрированием лучше для голоса подходит, чем линейная. Там можно частоту дискретизации снизить килогерц до 40.

То есть, позволяет "сжимать" файл?

 

Подсчитал, что на каждую секунду голосового сообщения могу выделить 5 кБ флеш.

Таким образом, нужно чем- то сделать файл с частотой дискретизации 5 кГц. Nero и стандартные утилиты Windows позволяют только до 8 опуститься

Изменено пользователем Misile_Inc

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

нет, это контейнер с заголовком

Дык, вот опосля заголовка, и непрерывно данные , собственно звук.

 

Редактор http://www.wavosaur.com/?utm_source=about&...aign=executable

 

Однобитовый звук? Не слышал, сейчас почитаю.

Кто ж его не слышал, но все будут нос воротить.

Просто входной сигнал подается на компаратор , и запоминаются "1" или "0".

Звук вполне нормальный , главное , хорошо фильтровать, а разборчивость зависит от диктора.

Я как-то скачал пару файлов из базы для тренировки распознавателей речи. Так там такие "говоруны" попадались: с 5-го раза разберешь, и то предварительно прочитав фразу.:)

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

Кто ж его не слышал, но все будут нос воротить.

:biggrin: друзья, вы в самом деле думаете что яйцеголовые ученные такие тупые? И что ваш "однобитный звук"(никто не мог додуматься, да) сожмет что-то круче чем LPC? :biggrin: Вопрос потянет ли контроллер LPC.

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

Вопрос потянет ли контроллер LPC.

Вопрос, а "однобитный звук" потянет счетчик . :)

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

Дык, вот опосля заголовка, и непрерывно данные , собственно звук.

там обычно PCM, однако сам контейнер на формат данных никаких ограничений вроде не накладывает

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

там обычно PCM, однако сам контейнер на формат данных никаких ограничений вроде не накладывает

А надо то что? PCM и есть тупо выборки. Вот ADPCM это уже типа сжатый.

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

А надо то что? PCM и есть тупо выборки. Вот ADPCM это уже типа сжатый.

ну так а я о чем? :biggrin:

чтобы не разбираться, в чем там сжато или нет в контейнере WAV (который еще и "отшелушить" надо от заголовка), сохраняем в RAW, параметры которого (битрейт, разрядность и стерео/моно) мы сами заранее знаем

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

Жирновато сразу по нескольким параметрам:габариты микросхемы, стоимость средств программирования и отладки, стоимость микросхемы. Зачем так круто?

 

Не факт.

Если рассмотреть вариант http://milandr.ru/index.php?mact=Products,...nt01returnid=68

корпус - LQFP64 с шагом 0,5 мм - весьма мелкий

стоимость - 165 рублей, не назвал бы ее заоблачной

Средства программирования - МТ-линк за 2500 рублей - вполне посильная затрата

 

И при этом встроенный 12 разрядный АЦП с частотой оцифровки до 500 кГц

Встроенный 2-х канальный ЦАП, тоже 12 разрядный

Вычислительной мощность не напрягаясь хватит - 80 МГц тактовая частота, Cortex M3 совместимый

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

Не факт.

Если рассмотреть вариант http://milandr.ru/index.php?mact=Products,...nt01returnid=68

корпус - LQFP64 с шагом 0,5 мм - весьма мелкий

стоимость - 165 рублей, не назвал бы ее заоблачной

Средства программирования - МТ-линк за 2500 рублей - вполне посильная затрата

 

И при этом встроенный 12 разрядный АЦП с частотой оцифровки до 500 кГц

Встроенный 2-х канальный ЦАП, тоже 12 разрядный

Вычислительной мощность не напрягаясь хватит - 80 МГц тактовая частота, Cortex M3 совместимый

Да, вы правы. В то время упустил из виду, что Миландр начал использовать пластик.

Сейчас проблема выбора архитектуры позади - информатор урезан в функциональности и выполнен на ARM7 фирмы Analog devices через DAC в составе другого прибора.

Проблема сейчас в том, что свободно всего 28 кБ флеш и сюда надо уместить 5 секунд звука + ПО, воспроизводящее звук.

Изменено пользователем Misile_Inc

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

Если звук это речь, то очень хорошо сжимает кодирование GSM. Насчет размера ПО декодера не могу сказать.

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

Присоединяйтесь к обсуждению

Вы можете написать сейчас и зарегистрироваться позже. Если у вас есть аккаунт, авторизуйтесь, чтобы опубликовать от имени своего аккаунта.

Гость
К сожалению, ваш контент содержит запрещённые слова. Пожалуйста, отредактируйте контент, чтобы удалить выделенные ниже слова.
Ответить в этой теме...

×   Вставлено с форматированием.   Вставить как обычный текст

  Разрешено использовать не более 75 эмодзи.

×   Ваша ссылка была автоматически встроена.   Отображать как обычную ссылку

×   Ваш предыдущий контент был восстановлен.   Очистить редактор

×   Вы не можете вставлять изображения напрямую. Загружайте или вставляйте изображения по ссылке.

×
×
  • Создать...