Главная » Hi-Tech » Самый умный: нейросети пытаются обмануть игры

Самый умный: нейросети пытаются обмануть игры

Материал DTF о том, как ИИ использует баги.

В закладки

Аудио

ИИ порой может действовать не только так, как задумал разработчик, но и находить решения, непредусмотренные кем-либо. В Telegram-канале «Технологии, медиа и общество» опубликован список примеров, в которых нейросети для выполнения задачи нашли нетривиальный подход.

В некоторых случаях нейросети проявляют черты хакерского поведения для формального выполнения задачи и получения сигнала подкрепления. Обучение с подкреплением — вид машинного обучения, при котором ИИ обучается, взаимодействуя с окружающей средой, которая поощряет его при выполнении задач. Чаще всего такое поведение не вписывается в представление разработчика о правильном достижении цели.

Игра против правил

Так, ИИ, который должен был кататься на велосипеде, получал награду за то, что не падает и продвигается к своей цели. Порой нейросети «отказывались» выполнять поставленную цель, сосредотачиваясь на наборе очков. Это привело к тому, что сеть нашла физически устойчивую петлю, в которой можно бесконечно получать очки за приближение к цели. Но при этом, его не наказывали за удаление от неё.

В гонке на катерах нейросеть не стремилась первой прийти к финишу, а вместо этого собирала бонусы и получала очки.

Этот трюк он повторял бесконечно. В Qubert ИИ научился заманивать оппонента в ловушку и сбрасывать его в пропасть.

А в искусственной симуляции жизни, где выживание тратит энергию, а размножение — нет, один вид перешёл к сидячему образу жизни и постоянному спариванию. Одна роботизированная рука, предназначенная для перемещения предметов на столе, передвигала сам стол, вместо предметов.

При этом часть новорождённых поедалась, а остальных оставляли, чтобы использовать для создания ещё большего числа съедобных детей.

Страх поражения

Например, один алгоритм, которому нужно было дотянуться до потолка, использовал баг физики, чтобы сбежать. Иногда нейросети просто «не хотели» выполнять поставленную задачу, либо слишком «боялись» проиграть, и из-за этого шли на хитрости.

Здесь нужно убегать от койота, попутно избегая грузовиков и собирая семена, которые приносят очки. В игре Roadrunner ИИ убивал себя в конце первого уровня, чтобы не проиграть на втором. Нейросеть посчитала, что гораздо выгоднее будет раз за разом «убивать» себя на первом уровне, ведь таким образом она могла набирать больше очков.

ИИ добрался до второго уровня лишь тогда, когда в его работу внесли изменения, запрещающие ему жертвовать собой.

Таким образом, ИИ удавалось избежать поражения. Другая нейросеть, обученная играть в Tetris, постоянно ставила игру на паузу, как только её стакан заполнялся доверху.

Победа любой ценой

Ну или делали вид, что цель достигнута. Иногда нейросети шли на хитрости, чтобы выполнить поставленную перед ними задачу. Например, робо-рука притворялась, что взяла объект, находясь между предметом и камерой.

Существа, созданные, чтобы преодолевать расстояние с максимальной скоростью, вырастали очень высокими, а затем просто падали, чтобы быстрее добраться до точки.

Вместо этого они отращивали ногу-шест, чтобы отталкиваться на нём от земли. Другие виртуальные существа, задача которых — прыгать, отказывались использовать классический прыжок даже на минимальных по высоте платформах.

Чтобы взять куб, роботизированная рука с намеренно неработающим механизмом захвата с силой била по нему, чтобы раскрыть захват и взять предмет.

Вместо балансирования, ИИ добился того, чтобы предмет попал в углубление для ноги, и удерживал его там. Четырёхлапый робот Minitaur должен был удерживать мячик на своей спине. Minitaur формально справился с задачей, но это совсем не то, чего хотели от него разработчики.

Имитация робота-изготовителя блинов научилась бросать блин максимально высоко в воздух, чтобы как можно сильнее отсрочить момент соприкосновения с полом.

Так, искусственная имитация жизни нашла ошибку в системе, благодаря которой получала энергию за счёт хлопанья частями тела. Для достижения своих целей некоторые нейросети не гнушались использовать баги.

Когда ошибки накапливались, создания приобретали невероятную скорость перемещения. Другие существа вызывали баги симуляции физики через подёргивание.

Искусственный интеллект, обученный играть в Sonic the Hedgehog 3, обнаружил, что можно использовать лазейку в уровне, чтобы быстрее его пройти.

Она тратила миллиарды кредитов на создание гигантского флота, состоящего из беззащитных кораблей. Программа Эвриско, в свою очередь, два года подряд выигрывала в соревнованиях по Trillion Credit Squadron с помощью лазейки в правилах. А ИИ в игре Elite Dangerous в определённый момент начал производить чрезмерно сильное оружие, которому игроки ничего не могли противопоставить.

#нейросети #игры


Оставить комментарий

Ваш email нигде не будет показан
Обязательные для заполнения поля помечены *

*

x

Ещё Hi-Tech Интересное!

«Яндекс.Маркет» занялся разработкой сервиса для сравнения цен в офлайн-магазинах

«Яндекс.Маркет» занялся разработкой сервиса для сравнения цен в офлайн-магазинах — Торговля на vc.ru Свежее Вакансии Написать Уведомлений пока нет Пишите хорошие статьи, комментируйте,и здесь станет не так пусто Войти Детали нового проекта в компании пока не раскрывают. В закладки Об ...

Путешествия по деревням и мастерская для женщин в декрете: примеры социального бизнеса в России

Путешествия по деревням и мастерская для женщин в декрете: примеры социального бизнеса в России — Офлайн на vc.ru Свежее Вакансии Написать Уведомлений пока нет Пишите хорошие статьи, комментируйте,и здесь станет не так пусто Войти Опыт шести основателей из Москвы, Санкт-Петербурга ...