Hi-Tech

ИИ научился распознавать объекты на картинках по голосовому описанию

Как и функция распознавания изображения. Уже достаточно давно существует технология распознавания речи. Видимо, именно так и подумали эксперты из Массачусетского технического университета (MIT), разработав алгоритм, способный определить отдельные объекты на изображении, основываясь лишь на речевом описании. Так почему бы их не совместить, улучшив сразу обе?

Устройство нейросети довольно просто: она состоит из двух взаимодействующих между собой частей. О весьма интересной технологии пишет издание Engadget. Входящее сообщение разделяется на короткие 1-2 секундные отрезки. Первая работает непосредственно с изображением – она разделяет его на сетку из ячеек, в то время как вторая отвечает за обработку аудио сигнала. Сами разработчики сравнивают такой метод с общением с ребенком, когда вы указываете ему на объекты и говорите ему их названия. После этого программа проверяет, насколько каждая ячейка разделенного изображения соответствует каждому 1-2 секундному аудиофайлу.

Для новой технологии есть довольно большой спектр применений, самый очевидный из которых – интеграция в поисковые системы, однако разработчикам больше по душе использование системы в качестве инструмента для переводов, способных распознать язык и подобрать подходящие слова с точностью до 100%.

«Вместо того, чтобы давать программе задание использовать «прямой» перевод, можно сделать его контекстно-зависимым и научить систему переводить на разные языки описания и назначения объектов в зависимости от ситуации.»

Эту и другие новости вы всегда можете обсудить в нашем чате в Телеграме.

Показать больше

Похожие публикации

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *

Кнопка «Наверх»