Hi-Tech

Искусственный интеллект Google обучился новому трюку

Более того, с каждым днем ИИ обучается все новым и новым приемам. Различные системы искусственного интеллекта уже умеют делать такие вещи, что впору задумываться о том, что сюжет кинофраншизы Терминатор – это не такая уж и фантастика. К примеру, недавно специалисты компании Google обучили свой искусственный разум идентифицировать голоса отдельных людей в шуме толпы с поразительной точностью.

Это то, что умеем делать все мы: общаясь с человеком в окружении посторонних шумов, мы можем понимать то, о чем он говорит, анализируя не только речь, но и мимику, отфильтровывая «мешающие» звуки. Для начала инженеры Google создали технологию на основе машинного обучения, которая выявляет голоса отдельных людей благодаря «эффекту вечеринки». Затем в Google обучили искусственный интеллект распознавать лица людей, изолировать их голоса и подавлять посторонние шумы. ИИ Google работает похожим образом: проводя анализ мимических мышц лица и всего шума, он выделяет голоса разных людей и создает из них отдельные аудиодорожки.

Это стало возможно благодаря тому, что инженеры Google «натаскали» ИИ на более чем 100 000 видеолекциях и разговорных видео с YouTube с фоновым шумом. Таким образом система может выделять из толпы шумящих людей необходимого человека и проводить распознавание его голоса в режиме реального времени. Результат работы алгоритма Google вы можете наблюдать на видеоролике, доступном ниже. Новая разработка, по словам Google, может быть использована, например, для улучшения качества видеочатов, чтобы во время группового общения пользователь смог сосредоточиться на одном собеседнике.

Показать больше

Похожие публикации

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *

Кнопка «Наверх»