WaveNet
-
Хабрахабр
[Перевод] Кодирование речи на 1600 бит/с нейронным вокодером LPCNet
В первом демо мы представили архитектуру, которая сочетает обработку сигналов и глубокое обучение для повышения эффективности нейронного синтеза речи. Это продолжение первой статьи о LPCNet. научную статью). На этот раз превратим LPCNet в нейронный речевой кодек с очень низким битрейтом (см. Его можно использовать на текущем оборудовании и даже на телефонах. Итоговый битрейт 1600 бит/с примерно в десять раз меньше,…
Читать далее » -
Хабрахабр
[Перевод] Codec 2 + нейросеть = целый подкаст на одной дискете
В предыдущей статье мы обсудили кодек Opus, который работает на очень низких битрейтах. Но другой кодек стремится достичь ещё более низких битрейтов — это Codec 2. И хотя битрейт впечатляет, звук не такой качественный, как в случае Opus, что можно услышать в аудиопримерах. Codec 2 предназначен для кодирования только речи. Тем не менее, в сочетании с нейросетью (WaveNet) кодек демонстрирует…
Читать далее »