WaveNet

  • ХабрахабрФото [Перевод] Кодирование речи на 1600 бит/с нейронным вокодером LPCNet

    [Перевод] Кодирование речи на 1600 бит/с нейронным вокодером LPCNet

    В первом демо мы представили архитектуру, которая сочетает обработку сигналов и глубокое обучение для повышения эффективности нейронного синтеза речи. Это продолжение первой статьи о LPCNet. научную статью). На этот раз превратим LPCNet в нейронный речевой кодек с очень низким битрейтом (см. Его можно использовать на текущем оборудовании и даже на телефонах. Итоговый битрейт 1600 бит/с примерно в десять раз меньше,…

    Читать далее »
  • ХабрахабрФото [Перевод] Codec 2 + нейросеть = целый подкаст на одной дискете

    [Перевод] Codec 2 + нейросеть = целый подкаст на одной дискете

    В предыдущей статье мы обсудили кодек Opus, который работает на очень низких битрейтах. Но другой кодек стремится достичь ещё более низких битрейтов — это Codec 2. И хотя битрейт впечатляет, звук не такой качественный, как в случае Opus, что можно услышать в аудиопримерах. Codec 2 предназначен для кодирования только речи. Тем не менее, в сочетании с нейросетью (WaveNet) кодек демонстрирует…

    Читать далее »


Кнопка «Наверх»