Hi-Tech

AlphaZero самостоятельно учится играть в игры на высочайшем уровне

В своей работе, опубликованной в журнале Science, ученые описывают свою новую систему и объясняют, почему считают, что она представляет собой большой шаг в направлении развития будущих систем ИИ. Группа ученых из группы DeepMind и Университетского колледжа в Лондоне разработала систему искусственного интеллекта, способную самообучаться игре и совершенствованию в трех сложных настольных играх.

С тех пор компьютеры становились все умнее и сегодня побеждают людей в таких играх, как шахматы, сёги и го. Прошло более 20 лет с тех пор, как суперкомпьютер Deep Blue победил чемпиона мира по шахматам Гари Каспарова и показал миру, как далеко продвинулись вычисления в сфере ИИ. В своей новой работе ученые описали создание искусственного интеллекта, который не только хорош в нескольких играх, но и обучается этому совершенствованию самостоятельно. Однако каждая из подобных программ настраивалась специально, чтобы стать мастером в отдельной игре.

AlphaZero: новый мастер

Это, разумеется, очень похоже на процесс обучения людей. Новая система под названием AlphaZero представляет собой систему обучения с подкреплением, то есть обучается, многократно играя в игру и учась на своем опыте. Ему даже партнеры не нужны. Задается базовый набор правил и компьютер играет в игру — сам с собой. Со временем он становится все лучше и лучше, превосходит не только людей, но и другие системы ИИ, разработанные для настольных игр. Он играет сам с собой много раз, отмечая хорошие и победные ходы. Совмещение двух технологий позволило системе научиться совершенствованию в игре. Данная система также использовала метод поиска «древа поиска Монте-Карло». Ученые опробовали силы программы, обеспечив ее большой мощностью — 5000 тензорных процессоров, работающих в паре с большим суперкомпьютером.

Следующим шагом станут популярные видеоигры. На текущий момент AlphaZero освоил шахматы, сёги и го. Что касается производительности ИИ, то в го, например, AlphaZero обыграл легендарного AlphaGo уже через 30 часов.

Расскажите в нашем чате в Телеграме. Как думаете, когда будет взрыв искусственного интеллекта?

Показать больше

Похожие публикации

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *

Кнопка «Наверх»