Хабрахабр

[Из песочницы] Цензурирование китайского интернета

Привет, Хабр! Представляю вашему вниманию перевод статьи "Learning China’s Forbidden History, So They Can Censor It".

Тысячи низкооплачиваемых работников на так называемых «фабриках цензуры» прочесывают онлайн-мир на предмет запрещенного контента, где даже фотография пустого стула может вызвать большие проблемы.

Как и многие молодые люди в Китае, 24-летний выпускник колледжа мало что знал о событиях на площади Тяньаньмэнь (Tiananmen) в 1989 году. Ли Чэнчжи (Li Chengzhi) было чему поучиться, когда он впервые устроился на работу в качестве профессионального цензора. Он никогда не слышал о самом знаменитом китайском диссиденте Лю Сяобо (Liu Xiaobo), лауреате Нобелевской премии мира, который умер, находясь под стражей, два года назад.

Он часами просматривает онлайн-контент для китайских медиа-компаний, ищущих что-либо, что может вызвать гнев правительства. Теперь, после определенного периода обучения, он знает, что искать и что блокировать. Он знает, как определять кодовые слова, которые косвенно относятся к китайским лидерам и скандалам, или мемы, которые затрагивают темы, о которых китайское правительство было бы непротив умолчать.

«Я помогаю очищать онлайн пространство» — говорит он. Г-н Ли, на лице которого все еще видны следы от прыщей, серьезно относится к своей работе.

В дополнение к этому, власти требуют, чтобы компании подвергали себя самоцензуре, стимулируя их таким образом нанимать тысячи людей для контроля контента. Для китайских компаний очень важно «быть на короткой ноге» с правительственными цензорами.

Это, в свою очередь, создало новую растущую и прибыльную индустрию: фабрики цензуры.

Он работает в офисе, в городе Чэнду (Chengdu), расположенном в самом сердце высокотехнологичной промышленной зоны, в достаточно новом и светлом офисе, который напоминает офисы хорошо финансируемых стартапов в таких технологических центрах, как Пекин и Шэньчжэнь (Shenzhen). Г-н Ли работает в пекинской компании Beyondsoft, занимающейся техническими услугами, которая, помимо всего прочего, берет на себя тяготы цензурирования других компаний. Они недавно переехали сюда, потому что заказчики жаловались на то, что их предыдущий офис был слишком тесен, для того, чтобы их сотрудники могли качественно выполнять свою работу.

(Beyondsoft отказывается афишировать, на какие китайские СМИ или онлайн-компании работает, ссылаясь на политику конфиденциальности). «Всего одно маленькое упущение может привести к серьезной ошибке» — говорит Ян Сяо (Yang Xiao), глава подразделения интернет-услуг и анализа контента Beyondsoft.

Эта система стала еще сильнее при президенте Си Цзиньпине (Xi Jinping), который хочет, чтобы интернет играл более важную роль в укреплении влияния Коммунистической Партии. Китай создал самую обширную и сложную в мире систему онлайн-цензуры. Все больше контента попадает в категорию сомнительного а наказания становятся все более суровыми.

Даже такие традиционные оплоты свободы слова, как Западная Европа и США, рассматривают свои собственные меры по ограничению цифрового пространства. После тщательной проработки вопросов контроля, Китай теперь проповедует политику Интернета, контролируемого правительством. Такие работники, как г-н Ли, демонстрируют крайности данного подхода, контролирующего то, что каждый день видят более 800 миллионов интернет-пользователей Китая. Такие платформы, как Facebook и YouTube, заявили, что они будут нанимать тысячи людей, чтобы лучше контролировать контент.

Они просматривают и проверяют контент днем ​​и ночью. В Beyondsoft, на фабриках по анализу контента, работают более 4000 человек (по сравнению с примерно 200 в 2016 году).

«Мы — Foxconn в индустрии данных» — говорит г-н Ян, сравнивая свою фирму с крупнейшим контрактным производителем, который штампует айфоны и другие продукты для Apple.

Они изучают способы внедрения искусственного интеллекта для автоматизации и ускорения работы. Многие онлайн медиа компании имеют свои собственные внутренние группы по анализу контента, количество которых порой исчисляется тысячами. Глава AI лаборатории крупной интернет-медиа-компании, пожелавшей остаться неизвестной, сказал, что компания разработала около 120 моделей машинного обучения.

Пользователи могут легко обмануть алгоритмы. Но успех непостоянен. «Они пропускают много вещей при просмотре контента». «Алгоритмы искуственного интеллекта достаточно сообразительны, но не до такой степени, как человеческий мозг » — сказал Ли.

У Beyondsoft имеется команда из 160 человек в Чэнду, работающих четыре смены в день, просматривающих потенциально неприемлемый контент в приложении агрегирования новостей.

Как и в остальной части мира, интернет в Китае изобилует порнографией и другими материалами, которые многие пользователи сочли бы неподобающими. Для того же приложения у Beyondsoft есть другая команда в западном городе Сиань (Xi’an), которая фильтрует потенциально оскорбительный и пошлый контент.

Им также запрещается делать скриншоты или отправлять какую-либо информацию со своих компьютеров. В офисе Чэнду работники должны оставлять свои смартфоны в специальных шкафчиках, в коридоре.

В большинстве своем они не интересуются политикой, или попросту безразличны к ней. Почти все работники — выпускники колледжа в возрасте от 20 лет. В Китае многие родители и учителя говорят молодежи, что забота о политике ведет к одним неприятностям.

Новые сотрудники начинают с недельного «теоретического» обучения, во время которого старшие сотрудники обучают их работе с конфиденциальной информацией, которую они не могли знать ранее. Для решения этого вопроса г-н Ян и его коллеги разработали комплексную систему обучения.

«Я частенько слышу возгласы удивления, доносящиеся оттуда». «Мой офис находится рядом с большой комнатой для обучения» — говорит г-н Ян. «Они порой не знают даже таких вещей, как 4 Июня», — добавил он, говоря о событии на площади Тяньаньмэнь (Tiananmen) в 1989 году.

Компания также использует антицензурное программное обеспечение для регулярного посещения запрещенных веб-сайтов, заблокированных правительством Китая. Beyondsoft разработала обширную базу данных, основанную на такой информации, которую г-н Ян называет одной из своих «ключевых компетенций». Новые сотрудники изучают эту базу данных так же тщательно, как при подготовке к вступительным экзаменам в колледж. После этого база данных обновляется. После двух недель изучения они проходят тест.

Работники должны запомнить эти лица: только государственные веб-сайты и получившие специальное одобрение политические блоги — так называемый «белый список» — могут публиковать фотографии высших руководителей. Заставка на каждом компьютере одинаковая: фотографии и имена нынешних и бывших членов Постоянного Комитета Политбюро, высшего руководства Коммунистической Партии.

Затем работники должны ответить на 10 вопросов, предназначенных для проверки их памяти. В начале смены работников информируют о последних инструкциях по цензурированию, отправленных заказчиками, которые в свою очередь, получают их от государственных цензоров. Результаты таких проверок влияют на размер их заработной платы.

Правильный ответ — Ли Сяолинь (Li Xiaolin) — давняя мишень онлайн-насмешек за ее предпочтения к дорогим модным вещам и за то, что она является одной из многих детей высокопоставленных чиновников, занимающих высокие должности. Вот пример одного из таких вопросов: Какое из следующих имен является именем дочери Ли Пэна (Li Peng), бывшего премьер-министра Китая?

Более сложные вопросы заключаются в разборе окольных путей, с помощью которых китайские интернет-пользователи избегают жесткой цензуры, чтобы просто поболтать о житейских делишках. Это относительно легкий вопрос.

Некоторые китайские пользователи начали использовать имена императоров, говоря о политических лидерах. Возьмем, к примеру, комментарий гонконгского новостного сайта 2017 года, в котором сравнивались шесть китайских лидеров времен Мао Цзэдуна (Mao Zedong) и императоры времен династии Хань (Han). Работники Beyondsoft должны были точно знать, какое имя императора связано с определенным именем лидера.

Это отсылки к г-ну Лю (Liu) — лауреату Нобелевской премии, которому не разрешили покинуть Китай для участия в церемонии награждения, вследствие чего, его представлял пустой стул. Здесь нашлись даже фотографии пустого стула. Ссылки на роман Джорджа Оруэлла «1984» также находятся под запретом.

Таким образом, если страница полна слов с цветовой маркировкой, то требуется более внимательно ее изучить. Программное обеспечение Beyondsoft просматривает веб-страницы и помечает потенциально оскорбительные слова разными цветами. Наличие только одного или нескольких помеченных слов допускается.

Политически некорректные слова составляют одну треть от общего количества, затем идут слова, связанные с порнографией, проституцией, азартными играми и ножами. Согласно веб-сайту Beyondsoft, служба мониторинга контента Rainbow Shield собрала более 100 000 основных «щекотливых» слов и более трех миллионов их производных.

Предполагается, что каждый работник в течение смены просматривает от 1000 до 2000 статей. Работники вроде г-на Ли, зарабатывают от 350 до 500 долларов в месяц, что является среднем уровнем заработной платы в Чэнду. В отличие от работников Foxconn, они не работают сверхурочно, потому что переработка может повредить точности проверки, говорит г-н Ян — исполнительный руководитель. Статьи, в приложениях просмотра новостей, должны быть одобрены или отклонены в течение часа.

В одной статье о Пэн Лиюань (Peng Liyuan), первой леди Китая, по ошибке была использована фотография известной певицы, которая, по слухам, была связана с другим политическим лидером. Допустить ошибку бывает довольно легко. По словам г-на Яна, ошибка была найдена кем-то еще, до того, как статья была опубликована.

Однажды он пропустил крошечную фотографию г-на Си (Xi) на веб-сайте, не входящем в белый список, т.к. Г-н Ли говорит, что почти все худшие ошибки были связаны с информацией о высших руководителях. Он до сих пор винит себя за эту оплошность. очень устал.

«Эта информация не предназначена для посторонних людей», — говорит он. Когда его спросили, поделился ли он с семьей и друзьями тем, что ему удалось узнать, например, новостями о событиях на площади Тяньаньмэнь, г-н Ли яростно ответил категорическим «нет». «Это может породить слухи, как только люди об этом узнают».

Это не было слухами. Но жестокие преследования являются историческими фактами. «Для определенных вещей, — говорит он — нужно просто соблюдать правила». Как он примиряет все это в своей голове?

Теги
Показать больше

Похожие статьи

Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *

Кнопка «Наверх»
Закрыть