Главная » Hi-Tech » DeepMind и Google: битва за контроль над искусственным интеллектом

DeepMind и Google: битва за контроль над искусственным интеллектом

Поднявшись на подиум наигранной походкой человека, пытающегося контролировать свои нервы, он сжал свои губы в непродолжительной улыбке и заговорил: «Что ж, сегодня я хочу поговорить о различных подходах к созданию…». Однажды вечером в августе 2010 года в конференц-зале на берегу залива Сан-Франциско на сцену вышел 34-летний лондонец по имени Демис Хассабис. И произнес это: «AGI». Он остановился, словно осознавая, насколько громко заявляет о своих амбициях.

ОИИ сможет выполнять отдельные задачи — вроде распознавания людей на фото или перевода языков, которые в настоящее время способны выполнять множества отдельных искусственных интеллектов в наших телефонах и компьютеров. ОИИ (AGI) означает общий искусственный интеллект, гипотетическую компьютерную программу, которая может выполнять интеллектуальные задачи так же хорошо, как и человек, или даже лучше. Они смогут разбираться в трудах по физике, писать романы, разрабатывать инвестиционные стратегии и поддерживать непринужденную беседу с незнакомцами. Они смогут одновременно поддерживать беседу, играть в шахматы и говорить по-французски. ОИИ сделает самые современные ИИ сегодня похожими на карманные калькуляторы. Они будут следить за ядерными реакциями, управлять сетями энергоснабжения и транспортным потоком, и без особых усилий добиваться успеха во всем остальном.

Но человеческий разум ограничен размером черепа, в котором находится мозг. Единственный интеллект, способный в настоящее время выполнять все эти задачи, принадлежит человеку. Поскольку ОИИ будет работать на компьютерах, он не будет страдать от подобных ограничений. Его мощность ограничена ничтожным количеством энергии, которую может обеспечить организм. ОИИ может начать с мониторинга ядерных реакций. Его интеллект будет ограничен только количеством доступных процессоров. Интеллект человеческого уровня, заручившийся скоростью и масштабируемостью компьютеров, избавит нас от проблем. Но достаточно скоро он обнаружит новые источники энергии, переваривая больше работы по физике в секунду, чем способен человек за тысячу лет. Хассабис заявил английской газете Observer, что ожидает от ОИИ решения, среди прочих дисциплин, таких проблем, как «рак, изменение климата, энергия, геномика, макроэкономика и финансовые системы».

Сингулярность — первая часть названия — относится к наиболее вероятному последствию появления ОИИ, по мнению футурологов. Конференция, на которой выступал Хассабис, называлась Singularity Summit. Быстрые циклы самосовершенствования приведут к взрыву машинного интеллекта, в результате чего люди останутся нюхать кремниевую пыль. Поскольку ОИИ будет обрабатывать информацию с высокой скоростью, он очень быстро станет очень умным. Поскольку это будущее основано исключительно на непроверенных предположениях, почти религиозно предполагают, что сингулярность окажется либо утопией, либо адом.

Речь Хассабиса, напротив, казалась скучноватой: «Системный нейронаучный подход к созданию ОИИ». Судя по названиям выступлений, участники конференции больше верили в первый исход: «Разум и как его построить», «ИИ против старения», «Заменяя наши тела», «Модифицируя границу между жизнью и смертью».

Он был одет в бордовый джемпер и белую рубашку на пуговицах, как школьник. Хассабис шагал между подиумом и экраном, говоря скороговоркой. До сих пор, объяснял Хассабис, ученые подходили к ОИИ с двух сторон. Его небольшой рост, казалось, только подчеркивал его интеллект. Этот подход был популярен в 1980-х и 1990-х годах, но не дал желаемых результатов. Один из подходов, известный как символьный ИИ, пытался описать и запрограммировать все правила, необходимые для системы, которая могла бы мыслить подобно человеку. Хассабис считал, что ментальная архитектура мозга слишком тонка, чтобы описывать ее таким образом.

Это имело определенный смысл. Другой подход собрал ученых, пытающихся воспроизвести физические сети мозга в цифровой форме. Но эти исследователи также двигались неверным путем, рассказал Хассабис. В конце концов, мозг это ложе человеческого интеллекта. Если глубже, они сосредоточились не на том уровне функционирования мозга. Их задача была сродни созданию карты всех звезд во Вселенной. Это было все равно что пытаться понять, как работает Microsoft Excel, взламывая компьютер и изучая взаимодействие транзисторов.

Другими словами, он должен сосредоточиться на понимании программного обеспечения мозга, а не его аппаратного обеспечения. Вместо этого Хассабис предложил золотую середину: ОИИ должен черпать вдохновение из широких методов, с помощью которых мозг обрабатывает информацию, а не из физических систем или конкретных правил, которые он применяет в конкретных ситуациях. Последние исследования, сказал Хассабис, показывают, что мозг обучается, воспроизводя пережитое во время сна, чтобы выявить общие принципы. Новые методы, такие как функциональная магнитно-резонансная томография (фМРТ), которые позволили заглянуть внутрь мозга во время его работы, намекнули, что такое понимание возможно. Исследователи ИИ должны подражать такой системе.

Два слова, стоящие рядом, напечатаны снизу: DeepMind. В правом нижнем углу открывающего слайда красуется логотип в виде круглого синего вихря. Хассабис битый год пытался получить приглашение на Singularity Summit. Это был первый раз, когда компания упоминалась публично. На самом же деле ему нужна была одна минута с Питером Тилем, миллиардером из Кремниевой долины, который финансировал конференцию. Лекция была его прикрытием. Хассабис хотел инвестиций Тиля.

Но Тиль верил в ОИИ еще больше, чем Хассабис. Хассабис никогда не говорил о том, почему ему нужна была поддержка именно Тиля. Он больше беспокоился о том, что сингулярность наступит нескоро. Выступая на Singularity Summit в 2009 году Тиль сказал, что его самым большим страхом перед будущим было не восстание роботов. Мир нуждался в новых технологиях, чтобы предотвратить экономический спад.

Когда Google купила компанию в январе 2014 года за 600 миллионов долларов, Тиль и другие первые инвесторы получили прибыль в размере 5000% от своих инвестиций. DeepMind в итоге собрал 2 миллиона фунтов стерлингов, из которых 1,4 миллиона были Тиля.

Можно было бы отдохнуть, сделать шаг назад, провести время наедине с деньгами. Для многих основателей это был бы счастливый конец. Он провел большую часть 2013 года, договариваясь об условиях сделки. Для Хассабиса же приобретение Google было лишь очередным шагом в его стремлении к ОИИ. Она должна была получить плюсы от владения Google, такие как доступ к денежным потокам и вычислительной мощности, не потеряв контроль. DeepMind должна была работать отдельно от своего владельца.

Каждый ингредиент был на месте, чтобы ускорить прибытие ОИИ и устранить причины человеческих страданий. Хассабис думал, что DeepMind сможет стать гибридом: у него будет двигатель стартапа, мозги величайших университетов и глубокие карманы одной из самых дорогостоящих компаний мира.

Ху из мистер Хассабис

Он был старшим из трех братьев и сестер. Демис Хассабис родился на севере Лондона в 1976 году в семье грека-киприота и китаянки с сингапурской кровью. Сам Хассабис занялся шахматами в возрасте четырех лет, наблюдая за игрой отца и дяди. Мать работала в британском универмаге John Lewis, а отец управлял магазином игрушек. К 13 годам он стал вторым в мире лучшим шахматистом в своем возрасте. Через несколько недель он уже обыгрывал взрослых. В восемь лет научился программировать на простеньком компьютере.

Получил работу программиста видеоигр в Bullfrog Productions. Высшее образование Хассабис получил в 1992 году, на два года раньше запланированного срока. Игра имела большой успех и была продана тиражом 15 миллионов копий, создав целый жанр игр-симуляторов, цель в которых была не одолеть противника, а оптимизировать функционирование огромной сложной системы, такой как бизнес или город. Хассабис написал Theme Park, в котором игроки создавали и управляли виртуальным парком развлечений.

Будучи подростком, он бегал между этажами на соревнования по настольным играм, одновременно соревнуясь в поединках в шахматы, скрэббл, покер и нарды. Помимо создания игр, Демис прекрасно в них играл. Го — древняя настольная стратегическая игра, которая значительно сложнее шахмат. В 1995 году, изучая информатику в Кембриджском университете, Хассабис поучаствовал в студенческом турнире по го. Никто не знал, играл ли Хассабис вообще в го прежде. Мастерство должно требовать интуиции, приобретенной многолетним опытом.

Затем он одолел победителя опытных игроков, хотя и с гандикапом. Сперва Хассабис выиграл турнир для начинающих. Мэтьюз взял Хассабиса под свое крыло. Чарльз Мэтьюз, мастер кембриджского го, проводивший турнир, вспоминает шок от того, как опытного игрока уничтожил 19-летний новичок.

Игры, в свою очередь, разожгли его увлеченность интеллектом. Интеллект и амбиции Хассабиса всегда проявлялись в играх. Игры предлагали среду обучения, которой не соответствовал реальный мир. Наблюдая за своим развитием в шахматах, он задавался вопросом, можно ли запрограммировать компьютеры учиться так же, как это делал он, накапливая опыт. Поскольку игры отделены от реального мира, их можно практиковать без помех и эффективно осваивать. Они были строгими и закрытыми. Игры ускоряют время: игроки создают преступный синдикат за несколько дней и сражаются на Сомме несколько минут.

В мае того года компьютер Deep Blue, принадлежащий IBM, одолел Гарри Каспарова, чемпиона мира по шахматам. Летом 1997 года Хассабис отправился в Японию. Матч привлек внимание всего мира и вызвал обеспокоенность по поводу растущей мощности и потенциальной угрозы компьютеров. Впервые компьютер победил гроссмейстера. Когда Хассабис встретился с Масахико Фуцзувэра, японским мастером настольных игр, он рассказал о планах, в которых сочетались его интересы к стратегическим играм и искусственному интеллекту: однажды он разработает компьютерную программу, чтобы победить величайшего игрока в го.

«В возрасте 20 лет Хассабис считал, что определенные вещи должны уже быть на своих местах, прежде чем искусственный интеллект сможет перейти на необходимый ему уровень», говорит Мэтьюз. Хассабис подходил к своей карьере методично. «У него был план».

Хассабис сосредоточился на одной чрезвычайно амбициозной игре Republic: The Revolution, сложной политической симуляции. В 1998 году он основал собственную игровую студию под названием Elixir. Теперь он попытался сделать это в игре. За несколько до этого, еще учась в школе, Хассабис сказал своему другу Мустафе Сулейману, что миру нужны грандиозные симуляции, чтобы смоделировать его сложную динамику и решить самые сложные социальные проблемы.

Elixir в итоге выпустила урезанную версию игры, чтобы получить теплые отзывы. Облечь его стремления в код было сложнее, чем ожидалось. В апреле 2005 года Хассабис закрыл Elixir. Другие игры провалились. Теперь Хассабису не хватало только одной важной области знаний, прежде чем он мог начать свой квест в поиске ОИИ. Мэтьюз считает, что Хассабис основал компанию просто для того, чтобы получить управленческий опыт. Он должен был понять человеческий мозг.

Он опубликовал весьма влиятельное исследование памяти и воображения. В 2005 году Хассабис получил докторскую степень по нейронауке в Университетском колледже Лондона. Хассабис выстраивал понимание мозга, необходимое для овладение ОИИ. Одна из работ, которая с тех пор цитировалась более 1000 раз, показала, что людям с амнезией также трудно представить новый опыт, что предполагает наличие связи между запоминанием и созданием мысленных образов. Большая часть его работ сводилась к одному вопросу: как человеческий мозг получает и сохраняет концепции и знания?

Миссия компании была заявлена такой же, как и сейчас: «решить интеллект», а затем использовать это для решения всего остального. Хассабис официально учредил DeepMind 15 ноября 2010 года. Как сказал Хассабис участникам Singularity Summit, это означает перевод нашего понимания того, как мозг выполняет задачи, в программное обеспечение, которое сможет использовать те же методы для обучения.

План по реализации ОИИ было невозможно извлечь из сотен исследований в области нейробиологии. Хассабис ни в коем случае не утверждает, что наука полностью постигла человеческий разум. Однако также возможно и то, что его уверенность превосходит реальность. Но он явно верит, что начать работу над ОИИ в той манере, которая ему импонирует, вполне возможно. В 2018 году команда австралийских исследователей поставила под сомнение выводы самого доктора наук Хассабиса. Мы пока очень мало знаем наверняка о том, как на самом деле функционирует мозг. Конечно, это всего лишь один документ, но он показывает, что наука, лежащая в основе работы DeepMind, далеко не доказанная.

Репутация компании быстро росла. Сулейман и Шейн Легг, одержимый ОИИ новозеландец, которого Хассабис также встретил в университете, присоединились как соучредители. «Он притягивает, как магнит», говорит Бен Фолкнер, бывший руководитель Deep Mind. Хассабис расцветал. Возможно, величайшим достижением DeepMind было ранний активный наем талантливых людей и удержание самых ярких и лучших из них. Многие новобранцы прибыли из Европы.

Такая программа построена так, чтобы собирать информацию об окружающей среде, а затем извлекать уроки из нее, многократно воспроизводя  свой опыт — точно так же, как Хассабис описывал активность мозга во время сна в своей лекции на Singularity Summit. Одна из техник машинного обучения, на которой сосредоточилась компания, выросла из двойного увлечения Хассабиса играми и нейронаукой: обучение с подкреплением.

Программе показывается виртуальная среда, о которой она ничего не знает, кроме правил, вроде игрового симулятора шахмат или видеоигры. Обучение с подкреплением начинается с чистого листа. Она состоит из слоев вычислительных структур, которые просеивают информацию, чтобы идентифицировать определенные особенности или стратегии. Программа содержит по крайней мере один компонент, известный как нейронная сеть. Сперва эти сети имеют минимальный успех, но их ошибки — и это важно — также в них кодируются. Каждый слой исследует среду на своем уровне абстракции. Если программа перемещает шахматную фигуру и в результате проигрывает игру, больше такой ошибки она не допустит. Постепенно они становятся все умнее и умнее, экспериментируя с различными стратегиями и получая награду в случае успеха. Большая часть магии искусственного интеллекта заключается в скорости, с которой он повторяет эти задачи.

Программа под названием AlphaGo вызвала удивление после того, как обыграла чемпиона мира в матче с пятью играми в Сеуле в 2016 году. Работа DeepMind достигла своего апогея в 2016 году, когда команда разработала программу искусственного интеллекта, в которой использовалось обучение с подкреплением наряду с другими методами игры в го. В следующем году улучшенная версия AlphaGo победила чемпиона Китая по го. Победа машины, которую наблюдали 280 миллионов человек, случилась на десять лет раньше, чем предсказывали машины.

Чемпионы среди людей, блестящие умы планеты, больше не стояли на вершине интеллектуальной пирамиды. Как и Deep Blue в 1997 году, AlphaGo изменил восприятие человеческих достижений. Хассабис сказал, что этот матч довел его до слез. Спустя почти 20 лет после того, как Хассабис заявил о своих амбициях Фудзувере, он их исполнил. Он остался благодарен Мэтьюзу.

Его изощество и изощренность, превосходство вычислительной силы, казалось, показывали, что DeepMind опередил конкурентов в создании программы, которая сможет исцелять болезни и управлять городами. DeepBlue победил благодаря грубой силе и скорости вычислений, но стиль AlphaGo казался художественным, почти человеческим.

DeepMind и искусственный интеллект

Но в ОИИ нет никакой уверенности. Хассабис всегда говорил, что DeepMind изменит мир к лучшему. Если и будет, кто будет держать бразды? Если он когда-нибудь появится, мы не знаем, будет это к лучшему или худшему, будет ли он подчиняться человеческому контролю.

Он всегда настаивал на том, чтобы DeepMind осталась в Лондоне. С самого начала Хассабис пытался защитить независимость DeepMind. Хассабису не нужно было продавать DeepMind Google. Когда Google купил компанию в 2014 году, вопрос о контроле стал более актуальным. Денег в Google обещали много, но он не хотел передавать компанию, которую он вырастил. Наличности хватало, и он набросал бизнес-модель, в рамках которой компания будет разрабатывать игры для финансирования исследований. В год, предшествующий приобретению, по словам источникам, обе стороны подписали договор — Соглашение о соблюдении этики и безопасности. В рамках сделки DeepMind создала соглашение, которое не позволило бы Google в одностороннем порядке взять под контроль интеллектуальную собственность компании. Это соглашение было составлено старшими адвокатами в Лондоне.

По словам того же источника, Совет по этике отнюдь не является косметической уступкой со стороны Google, а обеспечивает надежную юридическую поддержку DeepMind для сохранения контроль над его самой ценной и потенциально самой опасной технологией. Соглашение передает контроль над основной технологий ОИИ DeepMind, если она будет создана, в руки управляющего Совета по этике. Сама компания ничего не раскрывает. Имена членов комиссии не были обнародованы, но другой источник, близкий и к DeepMind, и к Google, сообщил, что все трое основателей DeepMind входят в Совет.

Один из них — преданность. Хассабис может определить судьбу DeepMind и другими методами. Его программа, которая предлагает увлекательную и важную работу без давления со стороны научных кругов, привлекла сотни самых талантливых экспертов мира. Сотрудники, как бывшие, так и нынешние, говорят, что исследовательская программа Хассабиса является одной из самых сильных сторон DeepMind. Многие сотрудники чувствуют большую связь с Хассабисом и его миссией, чем с его корпоративным родителем, которому нужны только доходы. У DeepMind есть дочерние офисы в Париже и Альберте. Лучше пусть таланты работают на DeepMind удаленно, чем окажутся в Facebook или Apple. Пока Хассабис сохраняет личную преданность, он обладает значительной властью над своим единственным акционером.

Компания в этом преуспела. У DeepMind есть еще один источник рычагов, хотя он требует постоянного пополнения: благоприятный ореол. После приобретения Google, компания неоднократно производила чудеса, которые привлекали внимание всего мира. AlphaGo был отличной рекламой. Другая программа научилась играть в шахматы с нуля, используя архитектуру, сходную с AlphaGo, и стала величайшим игроком всех времен всего через девять часов игры с самой собой. Один из примеров программного обеспечения может обнаружить паттерны при сканировании глаза, которые являются индикаторами дегенерации желтого пятна. В декабре 2018 года программа AlphaFold оказалась более точной, чем конкуренты, в прогнозировании трехмерной структуры белков из списка составляющих, потенциально способных лечить такие болезни, как Паркинсона и Альцгеймера.

В 2016 году DeepMind заявила, что сократила расходы Google на электроэнергию на 40%. DeepMind особенно гордится разработанными алгоритмами, которые рассчитывают наиболее эффективные средства охлаждения центров обработки данных Google, которые содержат примерно 2,5 миллиона компьютерных серверов. Google использовала алгоритмы для оптимизации своих дата-центров задолго до появления DeepMind. Но некоторые инсайдеры говорят, что это хвастовство преувеличено. Родительская компания Google Alphabet платит DeepMind за подобные услуги. Есть мнение, что DeepMind завышает свои заслуги, чтобы приобрести ценность в глазах Alphabet. Эти цифры меркнут по сравнению с накладными расходами DeepMind. В 2017 году последняя выставила Alphabet счет на 54 миллиона фунтов стерлингов. В целом, в 2017 году DeepMind потеряла 282 миллионов фунтов. В том же году она потратила 200 миллионов фунтов на персонал.

Но другие дочерние компании Alphabet привлекли внимание Рут Порат, скупого финансового директора Alphabet. Это копейки для богатого гиганта. Исследователи ИИ также задаются вопросом, «запоратят» ли DeepMind. Google Fiber, попытка построить провайдера интернет-услуг, была поставлена на паузу после того, как стало ясно, что инвестиции будут окупаться десятилетиями.

Это особенно ценно в то время, когда Google обвиняют в нарушении конфиденциальности пользователей и распространении фейковых новостей. Постепенное раскрытие достижений DeepMind в области ИИ является частью стратегии, постепенно выстраивающей репутацию компании. Пейдж очень близок к Хассабису. DeepMind также повезло заполучить сторонника на самом высоком уровне: Ларри Пейдж, один из двух основателей Google, ныне исполнительный директор Alphabet. В начале своей карьеры Пейдж сказал, что создал Google исключительно для того, чтобы основать компанию ИИ. Отец Пейджа — Карл — изучал нейросети в 1960-х годах.

Некоторые ученые жалуются, что им трудно опубликовать свою работу: им приходится преодолевать слои внутреннего одобрения, прежде чем они смогут даже подать работу на конференцию или в журнал. Тщательный контроль DeepMind над прессой не соответствует академическому духу, который пронизывает компанию. Но слишком жесткие обвинения могут испортить академическую атмосферу и ослабить лояльность сотрудников. DeepMind считает, что необходимо действовать осторожно, чтобы не напугать публику перспективой ОИИ.

Основатели и первые сотрудники компании приближаются к тому порогу, когда они могут уйти с финансовой компенсацией, которую они получили от покупки компании (акции Хассабиса, вероятно, стоят порядка 100 миллионов фунтов). Спустя пять лет после приобретения Google вопрос о том, кто контролирует DeepMind, становится критическим. Учитывая свой неустанный фокус, Хассабис вряд ли спрыгнет с корабля. Но источник, близкий к компании, предполагает, что Alphabet отодвинула выплаты учредителям на несколько лет. Но некоторые коллеги ушли. Он интересуется деньгами лишь постольку, поскольку они помогают ему в приближении цели всей своей жизни. Бен Лори, один из самых выдающихся инженеров безопасности в мире, вернулся в Google. Три инженера ИИ покинули компанию с начала 2019 года. Это, конечно, не так много, но DeepMind предлагает такую удивительную миссию и достойную оплату, что уходить никто и не должен.

Но одно недавнее событие вызвало обеспокоенность по поводу того, как долго компания сможет поддерживать свою независимость. Пока что Google не сильно мешал DeepMind.

DeepMind, медицина и искусственный интеллект

В феврале 2016 года было создано новое подразделение DeepMind Health во главе с Мустафой Сулейманом, одним из соучредителей компании. DeepMind всегда планировала использовать ИИ для улучшения здравоохранения. DeepMind получала бы вознаграждение в зависимости от показателей. Сулейман, чья мать работала медсестрой, надеялся создать программу под названием Streams, которая предупреждала бы врачей об ухудшении здоровья пациента. DeepMind была достаточно мудрой, чтобы осторожничать. Поскольку эта работа требовала доступа к конфиденциальной информации о пациентах, Сулейман создал Независимую экспертную комиссию (IRP), в которую попали хорошие английские специалисты в области здравоохранения и технологий. Тем не менее, к концу 2017 года Сулейман подписал соглашения с четырьмя крупными больницами. Впоследствии британский информационный комиссар обнаружил, что один из партнеров среди больниц нарушил закон при обработке данных пациентов.

Спустя пять дней объявили, что DeepMind Health должна присоединиться к усилиям материнской компании. 8 ноября 2018 года Google сообщила о создании собственного подразделения здравоохранения — Google Health. Согласно информации, полученной из запросов о свободе информации, она уведомила об изменении больницы-партнеры только за три дня. DeepMind никто не предупреждал. В 2016 году Сулейман написал, что «данные пациента никогда не будут связаны с учетными записями, продуктами или услугами Google». DeepMind отказалась сообщать, когда начались дискуссии о слиянии, однако сказала, что короткий промежуток между уведомлением и публичным объявлением отвечает интересам прозрачности. Его обещание, казалось, было нарушено.

По словам людей, близких к команде здравоохранения, все больше сотрудников планируют покинуть компанию после завершения процесса поглощения. Аннексия Google разозлила сотрудников DeepMind Health.

DeepMind заявила, что «мы все согласились с тем, что имеет смысл объединить эти усилия в одном совместном усилии с увеличенными ресурсами». Этот эпизод показывает, что периферийные части работы DeepMind уязвимы для Google. Это вызывает вопрос о том, будет ли Google применять ту же логику к работе DeepMind над ОИИ.

Она уже создала программное обеспечение, которое может учиться выполнять задачи на сверхчеловеческом уровне. Если смотреть масштабно, DeepMind добилась больших успехов. Игрок контролирует летучую мышь, которая может двигаться горизонтально и с ее помощью отбивает мячи, направляя их в блоки выше, которые уничтожаются при столкновении. Хассабис часто ссылается на Breakout, видеоигру для консоли Atari. Проигрывает, если мячик падает мимо платформы. Игрок побеждает, когда все блоки уничтожены. Это демонстрирует силу обучения с подкреплением и сверхъестественные способности компьютерных программ DeepMind. Без человеческих инструкций программа DeepMind не только научилась играть в эту игру, но и забрасывать мячи в пространство за блоками, чтобы использовать преимущество отскоков.

Но Хассабис кое-что умалчивает. Демонстрация, конечно, впечатляет. Навык, которым обзавелась программа DeepMind, настолько ограничен, что она не может реагировать даже на крошечные изменения в окружающей среде, которые человек мог бы с легкостью одолеть. Если виртуальную платформу поднять хоть ненамного выше, программа допустит ошибку. Для диагностического интеллекта не существует двух одинаковых органов тела. Но в мире есть много тонкостей. Поэтому выпуск программ в дикую природу сопряжен с трудностями. Для механического интеллекта два похожих двигателя никогда не будут одинаковыми в настройке.

Программа узнает, что рикошетирование от задней стены увеличивает ее счет. Второе, о чем редко говорит DeepMind, заключается в том, что успех в виртуальных средах зависит от наличия функции вознаграждения: сигнала, который позволяет программному обеспечению измерять свой прогресс. К сожалению, реальный мир не предлагает простых наград. Большая часть работы DeepMind с AlphaGo заключалась в создании функции вознаграждения, совместимой с такой сложной игрой. Мозг человека получает сигнал об успехе задачи прямо в процессе ее выполнения, а не после. Прогресс редко измеряется отдельными баллами.

AlphaGo играет в игры тысячи лет человеческого времени, чтобы чему-либо научиться. DeepMind нашла способ обойти это, используя огромное количество вычислительной мощности. DeepMind признает существование таких неясностей. Многие философы ИИ подозревают, что это решение неприемлемо для задач, которые предлагают более слабое вознаграждение. Решения, принятые в начале игры, имеют последствия, которые проявляются позже, что вполне свойственно извилистой и запоздалой обратной связи реальных задач. Недавно она занялась StarCraft 2, компьютерной стратегией. Программы также начали изучать функции вознаграждения, следуя отзывам людей. В январе программное обеспечение DeepMind обыграло несколько лучших игроков мира, и это было весьма впечатляюще, несмотря на жесткие ограничения. Но включение человеческих инструкций в цикл создает риск потери масштаба и скорости.

Для них стремление достичь высокой производительности в смоделированных средах затрудняет решение проблемы функции вознаграждения. Как нынешние, так и бывшие исследователи из DeepMind и Google на условиях анонимности выразили скепсис в том, что DeepMind сможет добиться ОИИ с помощью таких методов. В компании есть внутренняя конкуренция, когда программы конкурирующих команд борются за превосходство. И все же именно этот подход лежит в основе DeepMind.

Большая часть его карьеры была посвящена их созданию, большая часть его свободного времени была потрачена на процесс игры в них. Хассабис всегда видел жизнь как игру. Как и его программное обеспечение, Хассабис обучается на собственном опыте. В DeepMind он использует их для разработки сильного искусственного интеллекта. Но он также может создать ОИИ прямо под носом у Google, но вне его контроля. Погоня за ОИИ может в конечном итоге привести в тупик, попутно изобретая полезные медицинские технологии и одолевая лучших в своем мастерстве игроков. И если ему это удастся сделать, Демис Хассабис выиграет в самой сложной игре из всех.

Обсудить статью можно в нашем чате в Телеграме.

По материалам 1843magazine, Хал Ходсон


Оставить комментарий

Ваш email нигде не будет показан
Обязательные для заполнения поля помечены *

*

x

Ещё Hi-Tech Интересное!

Деньги из ничего: кто зарабатывает на «бессмысленном интернете»

Обзор популярных проектов и история возникновения этого феномена. В закладки Аудио Что такое «бесполезный интернет» Из них около 15 млн относятся к так называемому «бесполезному интернету». По данным сервиса Worldwidewebsize на 2019 год, в интернете доступно более 5 млрд сайтов. ...

В «Яндекс.Такси» появился пост финансового директора на фоне возможного IPO компании

В «Яндекс.Такси» появился пост финансового директора на фоне возможного IPO компании — Финансы на vc.ru Свежее Вакансии Написать Уведомлений пока нет Пишите хорошие статьи, комментируйте,и здесь станет не так пусто Войти Новый финдиректор участвовал в IPO «Ленты» и Luxoft. В ...