Речевой кодек для задачи, поставленной GeGel

Mister_DSP 0

8 декабря, 2016

Опубликовано 8 декабря, 2016 · Жалоба

Большая мощность будет в другой серии. :rolleyes:

На счет эфирного шума, если частотный детектор имеет SNR= -10дБ (минус!) то он вытащит из-под шума, если он гауссов и не превышает полезный сигнал более чем в 10 раз.

Я встречал разнотолки по поводу зависимости между мощностью передатчика и дальностью: то-ли корень 4-й степени или 2-й.

При переходе к мощности передатчика с 50 мВт на 1 Вт дальность во сколько увеличится? В 4,5 раза или в 2,1 раз ?

Прямая видимость без загораживания.

КБ Беркут почитал - стало совсем грустно: имеем 20-кратное потребление тока, а дальность всего в 2 раза...

Цитата

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

Милливольт 0

8 декабря, 2016

Опубликовано 8 декабря, 2016 (изменено) · Жалоба

На счет эфирного шума, если частотный детектор имеет SNR= -10дБ (минус!) то он вытащит из-под шума, если он гауссов и не превышает полезный сигнал более чем в 10 раз.

Воля Ваша, но причем тут детектор? Он не имеет никакого значения. Давайте забудем о модуляции вообще, и будем пока оперировать только немодулированными радиоимпульсами.

Итак, для улучшения приема в смысле сигнал/шум нам необходимо согласовать полосу пропускания канала со спектром передаваемого сигнала. Оптимальным решением будет согласованная фильтрация, когда АЧХ канала идентична нормированному спектру сигнала.

Достичь этого можно разными способами: порубить сигнал на идентичные куски и обеспечить когерентное накопление. При этом уровень сигнала будет расти пропорционально корню квадратному из количества усреднений, а уровень шума по этому же закону начнет снижаться. В результате С/Ш будет тем лучше, чем больше усреднений мы сделали.

Но это не значит, что указанный метод единственный и уникальный.

Точно так же мы можем ограничить эквивалентный битрейт (как и при когерентном накоплении) и ограничить полосу приемного тракта. При этом после прохождения приемных частотно избирательных цепей возрастут марковость нашего сигнала и его внутриспектральные связи. Соотношение сигнал/шум улучшится даже немножко лучше, чем при когерентном накоплении в предыдущем способе (при прочих равных условиях). Лучше потому, что АЧХ когерентного накопителя будет гребенчатой, что обеспечит некоторый проигрыш (хотя, в принципе, это лечится методом Уэлча).

Т.е. для получения наилучшего С/Ш правильнее всего иметь узкополосный сигнал и узкополосный приемный тракт.

Теперь к детектированию. Известно и строго доказано, что энергетически оптимальная модуляция одна-единственная: 180-градусная фазовая манипуляция (кстати, любая(!) ЧМ проигрывает этому методу). Оптимальное детектирование известно также со времен Котельникова – свертка принятого сигнала с его инвертированной во времени копией. Принятие решения описывается оптимальным приемником Котельникова в варианте т.н. «идеального наблюдателя».

И теперь вопрос: какие преимущества в приеме дает описываемый Вами детектор? Как это может быть – неверна старая теория или появилась новая? Почему станция с ЛОРА будет выигрывать относительно существующих радиотехнических средств?

Я встречал разнотолки по поводу зависимости между мощностью передатчика и дальностью: то-ли корень 4-й степени или 2-й.
При переходе к мощности передатчика с 50 мВт на 1 Вт дальность во сколько увеличится? В 4,5 раза или в 2,1 раз ?

Прямая видимость без загораживания.

Нельзя привязывать дальность к мощности! Во-первых: канал связи какой? Как в космосе при приемных параболах – чистый Гаусс? Или по земле ходим? Тогда – Райс с многолучевостью. Со всеми вытекающими.

Местность степь или на ней есть местные предметы? Если есть, то еще хуже. (Мне приходилось сталкиваться со случаями, когда многоэтажное здание на холме выполняло функцию классического ретранслятора Айзенберга – измерения показали фантастическую эффективность маломощной станции).

Какова проводимость подстилающей поверхности, она меняется от сезона к сезону? Если да, то как.

И т.д. и т.п.

Самое главное: чем ниже мощность, тем большее значение приобретают эти факторы. Мощный передатчик «пробивает» некоторые трудности (в ряде случаев на нелинейностях материалов в полосе распространения), а маломощный сигнал тухнет (личный опыт: вынянченная 50 мВт SSB портативка собственной разработки, которая блестяще выигрывала у 5-ваттных станций при испытаниях в речной долине, легла трупом в городе: то великолепная работа, то полная радионевидимость).

КБ Беркут почитал - стало совсем грустно: имеем 20-кратное потребление тока, а дальность всего в 2 раза...

Вполне себе правдоподобно...

Изменено 8 декабря, 2016 пользователем Милливольт

Цитата

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

Mister_DSP 0

9 декабря, 2016

Опубликовано 9 декабря, 2016 · Жалоба

Милливольт, возможно я хреновый оратор, но почему тогда разработчики технологии LoRa (это не только HopeRF, Semtech, но и даже MicroChip и другие...) говорят что реальная дальность связи с их модуляцией значительно выше по сравнению с другими видами, при прочих равных?

Прикладываю файлик-pdf с описанием принципа модуляции LoRa: LoRa™ Modulation Basics, если есть желание и время - прогляните его пожалуйста и дайте ответ - в чём там собака зарыта? (по бОльшей дальности).

an1200.22.rar

Пока я понял выигрыш идет из-за более низкого отношения сигнал/шум детектора, надбавки к бюджету связи из-за которого растут быстрее, чем потери бюджета из-за расширения полосы пропускания.

Ну и на счёт узкой полосы(очень! узкой) - в умных книгах написано, что узкополоски подвержены слижком интерференциям. Тоесть связь будет "через шаг", убедился сам, вогнав RFM96 в режим FSK, а также наигрался с CC1101. Там без FEC делать нечего!

А в LoRa уже и FEC и Spread Spectrum - второе даёт очень хорошую устойчивость к интерференциям: я радостный в пределах километра бегал по жилым кварталам и не заткнулось вообще !!! А вот FSK затыкался даже в квартире (12 метров от передатчика 10 мВт).

Про Ваш SSB трансивер с 50 мВт было интересно почитать! Очень здОрово, что мощность - не решающий фактор в дальности связи: срок службы источников питания без подзарядке также важный параметр!

Я с такой мощность установил дальность 3,5 км по прямой в городе с неровным рельефом без прямой видимости в снегопады... Антенны - проволочки.

Цитата

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

Милливольт 0

9 декабря, 2016

Опубликовано 9 декабря, 2016 · Жалоба

Милливольт, возможно я хреновый оратор, но почему тогда разработчики технологии LoRa (это не только HopeRF, Semtech, но и даже MicroChip и другие...) говорят что реальная дальность связи с их модуляцией значительно выше по сравнению с другими видами, при прочих равных?

Да реклама это, и ничего больше.

Где "реальная дальность связи с их модуляцией значительно выше"?? В канале Гаусса? Быть не может! В условиях практического применения? Не исключено. Но в КАКИХ именно условиях? И почему.

Без объяснения причин это напоминает абсолютную криптографию при нераскрытом алгоритме или рекламу батареек: "работают на 20% дольше". Дольше чего? Нет ответа.

Кстати, точно так же славили ППРЧ. Ура. Потом выяснилось, что тоже ... есть некоторые ограничения... иногда...

Или CDMA. Встречали безумную рекламу как они на 40 мВт кроют двухваттный GSM как бык овцу?

А ЛоРа расширяет спектр. Ну и молодцы, правильно. Сосредоточенные помехи "размажутся", интерференция будет меньше гадить.

Но у них получается, что расширять спектр методом ЛЧМ - это кошерно. А другие способы негодящи.

Точь в точь как Эдисон заказывал попиков для предания анафеме переменного тока - бо он от диавола. Но Доливо-Добровольский даже не заметил этих богослужений, и теперь весь мир использует трехфазный ток. Но весь мир знает Эдисона, но почти никто не знает о Добровольском, а ведь гений был.

Такова сила рекламы.

Цитата

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

Mister_DSP 0

9 декабря, 2016

Опубликовано 9 декабря, 2016 · Жалоба

Точь в точь как Эдисон заказывал попиков для предания анафеме переменного тока - бо он от диавола. Но Доливо-Добровольский даже не заметил этих богослужений, и теперь весь мир использует трехфазный ток. Но весь мир знает Эдисона, но почти никто не знает о Добровольском, а ведь гений был.
Такова сила рекламы.

Про Эдиссона и Доливо-Добровольского было интересно узнать, спасибо.

Но в случае с LoRa, я думаю, что это - перегиб! :rolleyes:

Я разочаровался в (G)FSK модуляции и теперь если делать "цыфру" - то только на базе технологий расширения спектра сигнала чип-последовательностью....

Цитата

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

Mister_DSP 0

25 декабря, 2016

Опубликовано 25 декабря, 2016 · Жалоба

Укатал девайс с вокодером в релиз:

Цитата

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

AlexandrY 2

25 декабря, 2016

Опубликовано 25 декабря, 2016 · Жалоба

Укатал девайс с вокодером в релиз:

Ого какой редкий кодек поставили.

Не слабоват ли канал для такого?

Последние статьи по LoRa говорят, что он сильно деградирует когда вокруг появляются LoRa-сети

Цитата

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

Милливольт 0

25 декабря, 2016

Опубликовано 25 декабря, 2016 (изменено) · Жалоба

Укатал девайс с вокодером в релиз:

Поздравляю!

Какая мощность, что интерференция, на каком битрейте остановились?

P.S. С кодеком забрезжил рассвет. Ряд начал сходиться, и алфавит перестал разбухать. Оказалось, пирсоновский коррелятор неприменим для случая оценки ортогональностей вокодерных спектров (умом двинуться: это как ножовка режет в доме, режет на улице, а в сарае не режет даже дерево). Нигде в литературе и намека на это не встретил... Пришлось рожать специальную функцию.

Кстати, интересный побочный выхлоп: вполне пристойно работает обычный (т.е. без алфавита) вокодер на скорости 800-600 при передаче только трех главных частотных компонент и непередаче амплитудных характеристик вообще(!). Звук, понятное дело, компрессированный, но для радиосвязи самое то.

Изменено 25 декабря, 2016 пользователем Милливольт

Цитата

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

Mister_DSP 0

25 декабря, 2016

Опубликовано 25 декабря, 2016 (изменено) · Жалоба

Ого какой редкий кодек поставили. Не слабоват ли канал для такого?

Если использовать только VS1063, то это : MP3, OGG Vorbis, IMA ADPCM, a-law, u-law - всё испытывал - работает, звук отличный даже на 64 кбит/с (моно), на 96 кбит/с вообще натурально звучит! Это профили используются, когда нужен качественный звук и дальность в районе 300-500 м.

С использованием мощей STM32 становится доступно пускать вокодеры - портировал Codec2 (450 бит/с, 700 бит/с), MELP 2400 бит/с - с него рожал MELP 1200, 600, и даже 400, 300 бит/с.

С уменьшением битрейта дальность растёт, а звук на грани разборчивости. Компромиссно на 600 бит/с. Хорош звук на 2400. На 300 - уже похож на роботоподобный.

Последние статьи по LoRa говорят, что он сильно деградирует когда вокруг появляются LoRa-сети

К счастью, пока не коснулось. О LoRa-сетях мало кто слышал в том месте где я живу...

Кроме LoRa, чип может FSK, GFSK, OOK. Минимальная полоса пропускания приемника до 5,4 кГц !

Какая мощность, что интерференция, на каком битрейте остановились?

В текущей прошивке :

мощность 50 мВт (есть возможность до 100 мВт раскачать)

битрейт 2400 бит/с (есть возможность до 300 бит/с - ещё не все прошивки зарелизил)

в LoRa режиме интерференция не проявляет себя на ближней дистанции (до 1 км),

в (G)FSK режимах интерференция есть даже в ближних зонах (десятки метров)

Пока пакет очень короткий, имеет присутствие сильного оверхеда пакета из-за длинной преамбулы.

С длинными пакетами можно вытянуть чутье на 3 дБ лучше, тогда возрастёт латентность (задержка речи) на низких битрейтах на 1..3 с.(в зависимости от конфигурации).

P.S. С кодеком забрезжил рассвет. Ряд начал сходиться, и алфавит перестал разбухать. Оказалось, пирсоновский коррелятор неприменим для случая оценки ортогональностей вокодерных спектров (умом двинуться: это как ножовка режет в доме, режет на улице, а в сарае не режет даже дерево). Нигде в литературе и намека на это не встретил... Пришлось рожать специальную функцию.

Вам проще! Потому что моих знаний пока хватило на то чтобы из 2400 сделать 600/300 бит/с путём объединения фреймов в мультифрейм.

Разработать вокодер с нуля я не умею! :)

Кстати, интересный побочный выхлоп: вполне пристойно работает обычный (т.е. без алфавита) вокодер на скорости 800-600 при передаче только трех главных частотных компонент и непередаче амплитудных характеристик вообще(!). Звук, понятное дело, компрессированный, но для радиосвязи самое то.

В служебной р/связи остановились на 600 бит/с.

Хотя есть некий twelp с 300 бит/с, и даже видео на ютубе про него, но я, просмотрев и послушав, пришел к выводу, что это - утка!

"Не верю!" - одним словом! :)

На 300 бит/с Codec2 звучит с хрустом, а в MELP 300 голос в робот-стиле.

Изменено 25 декабря, 2016 пользователем Mister_DSP

Цитата

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

Mister_DSP 0

7 января, 2017

Опубликовано 7 января, 2017 · Жалоба

удалось добиться чутья приёмника -130 дБм, что дало возможность связаться стабильно на 3 км по прямой в городе без прямой видимости на антенны-четвертухи с другим абонентом находящимся на улице.

смог прокачать LoRa-модем вокодером с битрейтом 975 бит/с. качество речи удовлетворительно - не мямлит и не робот....

с операторами поругался (кто принимал участие в испытаниях) - забраковали режимы Codec и MEL всё что ниже 800 бит/с.

Пришлось остановиться на -130 дБм.

С кодек-2 на 300 бит/с чутьё было -135 дБм, но звук вообще никакой.....

Последение новости проекта с вокодером тут: http://vrtp.ru/index.php?showtopic=27904&st=390

утолкал в корпус, сделал две:

протокол испытаний прошивки на 1500 бит/с:

Цитата

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

Милливольт 0

9 января, 2017

Опубликовано 9 января, 2017 (изменено) · Жалоба

Прочитал Вашу с Раковым дискуссию на тему о качестве звучания. Мне кажется, что Вы правы.

Но Вы напрасно используете нестандартизированные речевые фрагменты для демонстрации. Тем более, что Ваш голос имеет выраженную индивидуальность.

Когда делали ГОСТ для телефонии, то провели очень большую работу, причем каждая фраза специально адаптирована для групп звуков.

_20_mp4.wav

_19_mp4.wav

_21_mp4.wav

Попробуйте, и оппонент пусть попробует. Сразу будет нагляднейшая иллюстрация

А если Вы еще и 600 битовые иллюстрации сделаете, то будет вдвойне убедительно: почему Вы выбрали именно такой битрейт, а не другой.

Желаю Вашему изделию всяческих успехов и широкого применения.

Изменено 9 января, 2017 пользователем Милливольт

Цитата

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

Mister_DSP 0

11 января, 2017

Опубликовано 11 января, 2017 · Жалоба

Попробуйте, и оппонент пусть попробует. Сразу будет нагляднейшая иллюстрация
А если Вы еще и 600 битовые иллюстрации сделаете, то будет вдвойне убедительно: почему Вы выбрали именно такой битрейт, а не другой.

А он и не сможет попробовать, так как он вырвал откуда-то тот звуковой образец. Или лукавит, боится обнародовать свой вариант прежде времени.

Согласен с вами, что тестировать надо на ГОСТовских фразах, одно непонятно -мне в микрофон их говорить или заливать во Flash именно голоса этих дядей/тёть? :)

Желаю Вашему изделию всяческих успехов и широкого применения.

После небольшой передышки возобновлюсь.

Цитата

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

Mister_DSP 0

11 января, 2017

Опубликовано 11 января, 2017 (изменено) · Жалоба

Сделал несколько звуковых проб по ГОСТ-овским фразам для телефонии, фраза специально адаптирована для групп звуков.

В пробах в отдельных папках несколько мужских и женских голосов.

Женские голоса, как оказалось, воспроизводятся хуже.

a) Оригиналы - оцифровки с сэмплрейтом 8 кГц - то что подаётся на вокодер:

http://vrtp.ru/index.php?act=Attach&ty...t&id=721167

b ) MELP 2400 bps (Federal Standard - orig.) - оригинал на 2400 бит/с

http://vrtp.ru/index.php?act=Attach&ty...t&id=721169

c) MELP 1500 bps (modified) - модифицированный вариант на 1500 бит/с

http://vrtp.ru/index.php?act=Attach&ty...t&id=721170

d) MELP 975 bps (modified) - модифицированный вариант на 975 бит/с

http://vrtp.ru/index.php?act=Attach&ty...t&id=721171

e) Car Noise +12dB - оригинал/2400/1500/975 бит/с на фоне шумов авто-трассы, +12 дБ.

http://vrtp.ru/index.php?act=Attach&ty...t&id=721172

Подробнее: http://vrtp.ru/index.php?act=categories&am...mp;article=3660

Изменено 11 января, 2017 пользователем Mister_DSP

Цитата

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

Mister_DSP 0

12 января, 2017

Опубликовано 12 января, 2017 · Жалоба

Милливольт, хочу поинтересоваться у вас как специалиста по разработке вокодеров.

Можно ли звук, приложенный ниже сжать эффективно до 300 бит/с и меньше, но так чтоб разборчивость была ОЧЕНЬ близка к оригиналу?

В исходном звуковом образце частота дискретизации 6 кГц и данные пропущены через LPF со срезом 3 кГц. И потом через HPF со срезом 1 кГц. Затухание обоих фильтров 48 дБ/окт.

Итого имеем речевой сигнал очень обеднённый но разборчивый: 1-3 кГц тоесть ширина 2 кГц.

Его можно эффектно пожать?

Я так понимаю, что ни один из известных вокодеров здесь не подойдёт.

Каков вообще должен быть принцип?

Найти коэффииенты LPC? Сколько минимум их надо? Векторное квантование ?

По моим прикидкам чтобы сделать 500 бит/с - надо не более 24 бит (5 бит - энергия, 7 бит - основной тон, 1 бит - тон/шум, 11 бит - LPC коэффициенты или ссылка из кодовой книги по векторнуму квантовани.) При этом фрейм выбран 48 мс (оптимально 20 - 40 мс) - но терпимо.

в какую сторону плясать?

подозреваю такие кодеки пишут под заказ для ФСБ или аналогичных структур. везде кодеки с телефоноподобным речевым сигналом(диапазон 0-4 кГц)

LPF3kHz_HPF1kHz___6khz.wav

Цитата

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

Милливольт 0

12 января, 2017

Опубликовано 12 января, 2017 (изменено) · Жалоба

Идея ограничения полосы пропускания именно перед вокодером для более успешного сжатия начала прорабатываться английскими разработчиками с 1949 года. Основная мысль была такова: делим речевой сигнал на две полосы - низкочастотную, которую кодируем обычной ИКМ с пониженной частотой дискретизации, и высокочастотную, которую подаем на специализированный вокодер.

При синтезе эти сигналы суммируются, и нормальный спектр речевого сигнала восстанавливается. Разработка получила название "Полувокодер" и была успешно запущена в единичных экземплярах.

Так что - ничего нового под луной. В данном случае предлагается вариант полувокодера с отрезанной низкочастотной частью.

Что касается кодирования такого сигнала, то вокодер нужно будет адаптировать, т.к. АЧХ и ФЧХ примененных фильтров будут определять работу системы обнаружения пульса.

Сделал Вам иллюстрацию: как видите, ничего хорошего не получилосьRESUL.WAV скорость 800.

Кстати, у МЕЛПа действительно есть какое-то неприятие русскоговорящими пользователями. Я прокручивал своим сотрудникам МЕЛП и своего новорожденного. Результат для МЕЛПа:

- И это по-каковски оно (!!) говорит? Это английский?

- Нет, конечно, слушай внимательно.

- А что оно сказало?

- Слушай еще раз!

- А-а-а, теперь все понятно

Если же МЕЛПовскую запись подать на компрессор типа полулогарифматора, то эти претензии уходят. Но получается очень жесткий и шумный сигнал, похожий на «поехали!» применявшийся в старой космической связи. Но разборчивость растет.

Изменено 12 января, 2017 пользователем Милливольт

Цитата

Mister_DSP 0

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

Милливольт 0

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

Mister_DSP 0

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

Милливольт 0

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

Mister_DSP 0

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

Mister_DSP 0

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

AlexandrY 2

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

Милливольт 0

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

Mister_DSP 0

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

Mister_DSP 0

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

Милливольт 0

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

Mister_DSP 0

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

Mister_DSP 0

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

Mister_DSP 0

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

Милливольт 0

Поделиться сообщением

Ссылка на сообщение

Поделиться на другие сайты

Присоединяйтесь к обсуждению

Обзор

Активность