Хабрахабр

[Перевод] Как Google пытается разработать поисковую систему с цензурой для Китая

Изданию The Intercept удалось ознакомиться с конфиденциальными документами, описывающими, как в компании Google проводили анализ поисковых запросов на пекинском сайте, чтобы разработать чёрные списки слов для поисковой системы с цензурой, которую компания планирует запустить в Китае.

Инженеры работают с цензурированным поиском с сайта 265.com, каталога сайтов на китайском языке, принадлежащего непосредственно Google.

В 2008 Google приобрёл этот сайт, работающий сейчас, как подразделение компании. В отличие от сервисов типа Google.com или YouTube, 265.com не заблокирован в Китае так называемым "великим китайским файрволом", ограничивающим доступ к сайтам, которые компартия Китая считает неблагонадёжными.
265.com основал в 2003 году Цай Веншень, китайский предприниматель, известный, как «крёстный отец китайских веб-мастеров». Анализ показывает, что 265.com находится на серверах Google, при этом его физический адрес принадлежит компании Beijing Guxiang Information and Technology Co., базирующейся в офисном здании на северо-западе района Пекина Хайдянь.

Также там есть возможность вести поиск по сайтам, изображениям, видеороликам и другому контенту. На 265.com можно найти обновления новостей, ссылки на информацию по финансовым рынкам, рекламу дешёвых перелётов и отелей. Однако все поисковые запросы перенаправляются на Baidu, самую популярную поисковую систему в Китае, основного конкурента Google в стране.

Использование сайта компанией открывает нам подробности механики, стоящей за планируемой к открытию поисковой платформой с цензурой, известной под кодовым именем Dragonfly, которую компания готовит с весны 2017 года. Судя по всему, Google использовал 265.com как honeypot для маркетинговых исследований, сохраняя информацию по поискам пользователей перед тем, как отправлять их на Baidu.

Разработчики Dragonfly использовали инструмент BeaconTower, чтобы проверить, блокируются ли эти сайты китайским файрволом. Собрав примеры запросов с 265.com, инженеры Google использовали их, чтобы изучить список сайтов, которые видят люди в ответ на введённые запросы. Они сделали список из тысяч заблокированных сайтов, и интегрировали эту информацию в версию поисковика Google с цензурой, чтобы он автоматически влиял на результаты поисковой выдачи, и не выдавал сайты, запрещённые в Китае, на первой странице, которая видна пользователям.

Google планирует открыть в Китае поисковую платформу, доступ к которой будет возможен через специальное мобильное приложение для Android, которую можно найти под различными именами, в частности, Maotai и Longfei. Согласно документам и людям, знакомым с проектом Dragonfly, команды программистов и инженеров Google уже создали рабочую версию поисковой системы с цензурой.

Приложение с цензурой будет «отправлять чувствительные запросы в чёрный список», и в ответ на определённые слова и фразы «никаких результатов показано не будет» – так написано во внутренних документах Google. Приложение было специально разработано так, чтобы отфильтровывать контент, проходящий у авторитарного китайского правительства под грифом «чувствительный», например, информацию о политических оппонентах, свободе слова, демократии, правах человека и мирных протестах.

В январе Google заключила договор с китайской компанией Tencent, и прокомментировала это следующим образом: сотрудничество позволит ей «сконцентрироваться на создании улучшенных версий продуктов и сервисов». Из анализа попавших в редакцию The Intercept документов видно, что этот поисковый проект Google разрабатывается в рамках совместного предприятия с участием другой компании – вероятно, расположенной в Китае, поскольку там интернет-компании по законы обязаны держать свои сервера и дата-центры внутри страны. Двухпартийная группа из шести сенаторов США просит генерального директора Google Сундара Пичаи разъяснить, связана ли сделка с Tencent с поисковым предложением, поддерживающим цензуру.

Документы, попавшие в редакцию, говорят о том, что «у совместного предприятия будет возможность» добавлять в чёрный список сайты и «чувствительные запросы». Неясно, сможет ли партнёрская компания Google в рамках совместного предприятия обновлять чёрные списки в одностороннем порядке.

Источник сообщил, что вполне вероятно, что сторонняя компания сможет «обновлять чёрный список без одобрения Google», хотя гарантировать это источник не может. Один знакомый с проектом источник сообщил редакции, что Google запланировала обеспечить партнёрской компании «программный интерфейс приложения», API, который потенциально можно использовать для пополнения списка запрещённых фраз и слов. О подробностях работы API ранее не сообщалось.

До обнародования информации по Dragonfly лишь несколько сотен из 88 000 работников Google узнали об этом проекте – порядка 0,35% персонала.

Одна команда концентрируется на локализацию погоды и результатов спортивных соревнований для Китая; другая работает над инфраструктурой поисковой системы; третья состоит из дизайнеров и экспертов по китайскому языку, создающих мобильное приложение. Среди работающих над проектом сотрудники есть люди, задачей которых является внедрение цензуры в поисковую выдачу.

Также люди, знакомые с проектом, говорят, что о разработке поиска с цензурой сообщили сотрудникам из департамента разработки политики, пользовательского опыта и юридического отдела. Избранным членам команд Gmail и YouTube сообщили определённые сведения об этих планах под присмотром менеджеров продуктов, проводивших время над изучением профилей людей, которые с большой вероятностью будут использовать Google в Китае.

«Нам сказали, чтобы мы не рассказывали о нём членам своих команд, а если те спросят, над чем мы работаем, не отвечать», — сказал источник, знающий об этих планах, который, как и другие источники для этого интервью, пожелал остаться неизвестным, поскольку не имел права связываться со СМИ. Сотрудникам компании, связанным с проектом Dragonfly, приказали не распространяться об этом.

Боссы закрывают доступ к документам, содержащим информацию об этом цензурном проекте. Следом за откровениями о проекте Dragonfly, о котором большая часть сотрудников Google узнала впервые, по офисам компании по всему миру начал распространяться гнев. Работникам приказали быть «в расстроенных и испуганных чувствах» из-за «полного молчания со стороны руководства».

Google не отвечает на просьбы прокомментировать эту историю. Спустя неделю после раскрытия этой информации руководство Google так и не выпустило никаких внутренних комментариев по поводу своих планов. Пресс-офис пока отказывается отвечать на вопросы десятков репортёров о проекте Dragonfly, отвечая, что «не будет комментировать догадки по поводу будущих планов».

Один мем демонстрирует, как китайский пользователь ищет информацию о событиях на площади Тяньаньмэнь от 1989 года, и получает в ответ сообщение о том, что все события вымышлены. Один инсайдер рассказал The Intercept, что в компании циркулируют мемы по поводу китайской цензуры.

До её пропажи она опубликовала в интернете видео, на котором портит постер с изображением президента Си Цзиньпиня, объявляя, что находится в «оппозиции к тирании и диктатуре Си Цзиньпиня, а также к угнетению через промывку мозгов, осуществляемому китайской коммунистической партией». Другой мем отсылает к Дон Яодзи [Dong Yaoqiong], 29-летней активистке, пропавшей в Шанхае в прошлом месяце после организации протеста.

В меме поиск информации по Дон не возвращает никаких результатов.

Показать больше

Похожие публикации

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *

Кнопка «Наверх»