ASR

  • ХабрахабрФото [Из песочницы] Исследовательский практикум. Голосовые виртуальные ассистенты – что с ними не так?

    [Из песочницы] Исследовательский практикум. Голосовые виртуальные ассистенты – что с ними не так?

    Введение Аналитики, исследующие сервисы чат-ботов и виртуальных ассистентов, обещают рост рынка как минимум 30% в год. В абсолютных цифрах, по состоянию на 2019 год, рынок оценивался более чем в 2 миллиарда долларов в год. Виртуальных голосовых помощников выпустили практически все ведущие мировые IT-компании, а основную работу по их популяризации уже провели Apple, Google и Amazon. На российском рынке тоже наметились…

    Читать далее »
  • ХабрахабрФото Огромный открытый датасет русской речи версия 1.0

    Огромный открытый датасет русской речи версия 1.0

    Подробнее о нашей мотивации и о том, как всё начиналось,можно прочитать в этой статье — Огромный открытый датасет русской речи. В начале этого года по ряду причин мы загорелись идеей создать самый большой открытый датасет русской речи. 0. С тех пор наш проект прошел через ряд масштабных изменений, мы в три раза увеличили количество данных, повысили их качество, добавили лейблы…

    Читать далее »
  • ХабрахабрФото End2End-подход в задачах Automatic Speech Recognition

    End2End-подход в задачах Automatic Speech Recognition

    Что такое End2End-распознавание речи, и зачем же оно нужно? В чем его отличие от классического подхода? И почему для обучения хорошей модели на основе End2End нам потребуется огромное количество данных — в нашем сегодняшнем посте. Классический подход к распознаванию речи Прежде чем рассказать про End2End-подход, стоит сначала поговорить про классический подход к распознаванию речи. Что он из себя представляет? Feature…

    Читать далее »
  • ХабрахабрФото Огромный открытый датасет русской речи

    Огромный открытый датасет русской речи

    Специалистам по распознаванию речи давно не хватало большого открытого корпуса устной русской речи, поэтому только крупные компании могли позволить себе заниматься этой задачей, но они не спешили делиться своими наработками. Мы торопимся исправить это годами длящееся недоразумение. Итак, мы предлагаем вашему вниманию набор данных из 4000 часов аннотированной устной речи, собранный из различных интернет-источников. Подробности под катом. 3: Вот данные…

    Читать далее »
  • ХабрахабрФото Тактичный робот: умеет слушать и не перебивает

    Тактичный робот: умеет слушать и не перебивает

    Распознавание речи (далее – ASR, Automatic Speech Recognition) используется при создании ботов и/или IVR, а также для автоматизированных опросов. Voximplant использует ASR, предоставляемый «корпорацией добра» – гугловское распознавание работает быстро и с высокой точностью, но… Как всегда, есть один нюанс. Человек может делать паузы даже в коротких предложениях, при этом нам нужна гарантия, что ASR не воспримет паузу как окончание…

    Читать далее »
  • ХабрахабрФото Тренинг FastTrack. «Сетевые основы». «Строение роутеров, платформы маршрутизации от Cisco». Эдди Мартин. Декабрь, 2012

    Тренинг FastTrack. «Сетевые основы». «Строение роутеров, платформы маршрутизации от Cisco». Эдди Мартин. Декабрь, 2012

    Около года назад я заприметил интереснейшую и увлекательную серию лекций Эдди Мартина, который потрясающе доходчиво, благодаря своей истории и примерам из реальной жизни, а также колоссальному опыту в обучении, позволяет приобрести понимание довольно сложных технологий. Мы продолжаем цикл из 27 статей на основе его лекций: Тренинг FastTrack. «Сетевые основы». «Понимание модели OSI». Часть первая. Эдди Мартин. Декабрь, 2012 Тренинг FastTrack.…

    Читать далее »


Кнопка «Наверх»