Создатель виртуальных ассистентов считает, что они обречены без нового подхода в области ИИ

Марк Левин20.03.2019

0 1 Время чтения: 4 мин.

Он считает, что нынешних технологий ИИ недостаточно, чтобы сделать Siri или Alexa по-настоящему умными. Борис Кац построил карьеру, помогая машинам овладеть языком. Но Бориса Каца, главного научного сотрудника MIT, это не впечатляет. Siri, Alexa, Google Home — технологии, которые анализируют язык, все чаще находят свое применение в повседневной жизни. За последние 40 лет он внес ключевой вклад в лингвистические способности машин.

Идеи, использованные в START, помогли Watson победить в Jeopardy! В 1980-х он разработал систему START, способную отвечать на сформулированные естественным языком запросы. и заложили основу для сегодняшних чатботов.

MIT Technolody Review взял интервью у Бориса Каца. Но сейчас Кац обеспокоен тем, что эта область опирается на идеи, которым много лет, а эти идеи никак не приближают машинный интеллект к реальному. Давайте узнаем, куда нужно направлять исследования, чтобы машины стали умнее.

Как сделать искусственный интеллект по-настоящему умным

С чего началась ваша история обучения компьютеров использованию языка?

Машина, которой я пользовался, называлась БЭСМ-4. Впервые я столкнулся с компьютерами в 1960-х годах, будучи студентом Московского университета. Мой первый компьютерный проект включал обучение компьютера чтению, пониманию и решению математических задач. Для связи с ней можно было использовать только восьмеричный код.

Я до сих пор помню, как стоял в машинной комнате в ожидании очередного стихотворения, созданного машиной. Затем я разработал компьютерную программу, пишущую стихи. И тогда и там я понял, что хочу всю оставшуюся жизнь работать над созданием интеллектуальных машин и поиском способов общения с ними. Я был ошеломлен красотой стихов; казалось, что они созданы разумным существом.

Что вы думаете о Siri, Alexa и других личных помощниках?

Забавно говорить об этом, потому что, с одной стороны, мы очень гордимся этим невероятным прогрессом — у каждого в кармане есть нечто, что мы помогли создать много-много лет назад, и это замечательно.

Так что чувство гордости перемежается чувством стыда. Но с другой стороны, эти программы невероятно глупые. Вы запускаете нечто, что люди считают разумным, но оно даже и близко не такое.

Разве это не делает машины лучше в понимании языка? Благодаря машинному обучению, в искусственном интеллекте произошел значительный прогресс.

Если вы посмотрите на достижения машинного обучения, все идеи появились 20-25 лет назад. С одной стороны, есть этот драматический прогресс, но с другой — часть этого прогресса раздута. Какой бы эта технология великой ни была, она не решит проблему настоящего понимания — настоящего интеллекта. Просто инженеры в итоге проделали большую работу и воплотили эти идеи в жизнь.

И поскольку люди обычно производят одни и те же предложения большую часть времени, их очень легко найти в языке. На очень высоком уровне современные методы — статистические методы, такие как машинное обучение и глубокое обучение, очень хороши для нахождения закономерностей.

Машина лучше вас знает, что вы собираетесь сказать. Посмотрите на предиктивный ввод текста. Поскольку мы постоянно говорим одно и то же, очень легко создавать системы, которые ловят закономерности и ведут себя так, будто они разумны. Вы можете назвать это разумным, но на самом деле она просто считает слова и цифры. Это фиктивный характер большей части современного прогресса.

Как насчет «опасного» инструмента генерации языка, представленного недавно OpenAI?

Языковая модель OpenAI была обучена на 8 миллиона веб-страниц, чтобы предсказывать следующее слово, учитывая все предыдущие слова в определенном тексте (на такую же тему). Эти примеры действительно впечатляют, но я не совсем понимаю, чем они нас учат. Этот огромный объем обучения, безусловно, обеспечивает локальную согласованность (синтаксическую и даже семантическую) текста.

Как вы думаете, почему искусственный интеллект движется в неверном направлении?

Но человеческий мозг не может выучить язык, используя такую парадигму. В обработке языка, как и в других областях, был достигнут прогресс в обучении моделей на огромных объемах данных — миллионах предложений. Мы не оставляем наших детей с энциклопедией в кроватке, ожидая, что они освоят язык.

Люди живут в физической среде, наполненной визуальными, тактильными и лингвистическими сенсорными данными, и избыточный и взаимодополняющий характер этих вводов позволяет детям осмысливать мир и одновременно изучать язык. Когда мы видим что-то, мы описываем это языком; когда мы слышим, как кто-то говорит что-то, мы представляем, как описанные объекты и события выглядят в мире. Возможно, изучая эти методы в отдельности, мы сделали проблему сложнее, а не проще?

Почему здравый смысл важен?

Конечно, вы хотите, чтобы робот понял, что красная коробка слишком маленькая и вы могли продолжить содержательный разговор. Скажем, ваш робот помогает вам собирать вещи, и вы говорите ему: «Эта книга не поместится в красную коробку, потому что она слишком маленькая». Но если вы скажете роботу: «Эта книга не поместится в красную коробку, потому что она слишком большая», робот должен догадаться, что это книга очень большая, а не коробка.

Тем не менее, как вы могли видеть из этих и других примеров, оно часто опирается на глубокое понимание мира, который в настоящее время недоступен для наших машин: понимание здравого смысла и интуитивной физики, понимание убеждений и намерений других, способность визуализировать и рассуждать о причине и следствии, и многое другое. Понимание, к какой сущности разговора идет отсылка, очень важно, и люди выполняют эту задачу каждый день.

Почему? Вы пытаетесь научить машины языку, используя симулированные физические миры.

Но так делают наши компьютеры сегодня. Я еще не видел ребенка, родители которого кладут энциклопедию в кроватку и говорят: «Иди учись». Я не думаю, что эти системы будут учиться так, как мы хотим, или понимать мир так, как мы хотим.

Затем младенцы начинают видеть мир и впитывать события и свойства объектов. В случае с детьми, они сразу же получают тактильные ощущения от мира. И только так творится магия понимания. Затем ребенок слышит языковой ввод.

Какой подход наилучший?

Исследования ИИ должны основываться на идеях психологии развития, когнитивной науки и нейробиологии, а модели ИИ должны отражать то, что уже известно о том, как люди изучают и понимают мир. Одним из способов продвижения вперед будет получение более глубокого понимания человеческого интеллекта, а затем использование этого понимания для создания интеллектуальных машин.

Вместе мы приблизимся к пониманию интеллекта и выяснению того, как воспроизвести его в интеллектуальных машинах, которые могут говорить, видеть и действовать в нашем физическом мире. Реальный прогресс начнется только тогда, когда ученые выйдут из своих офисов и начнут общаться с людьми в других областях.

Расскажите в нашем чате в Телеграме. Согласны с Борисом?

Теги
alexa siri Искусственный интеллект Исследования