Хабрахабр

[Перевод] Что в имени? Анализ данных названий 5820 игр в Steam

«Что в имени»? Больше, чем можно подумать. Если вы уже давно работаете над своей игрой или находитесь на этапах планирования, то в какой-то момент вам всё равно придётся выбирать ей название. Названия видеоигр могут стимулировать воображение и вызывать ностальгические воспоминания.

В Steam ежегодно выпускается больше шести тысяч игр, но какая их часть вызывает интерес игроков? Давайте рассмотрим исследование, в котором мы изучили названия игр, выпущенных в прошлом году.

Почему названия важны?

Прежде чем переходить к цифрам, давайте вкратце обсудим то, почему название видеоигры — это очень важно. Хотя оно может казаться незначительной частью общих ощущений от игры, на самом деле название является ключом, особенно когда дело доходит до маркетинга. В бешеном мире цифрового маркетинга название, рекламный слоган и одно-два изображения могут оказаться единственным, что увидит потенциальный покупатель.

В магазине Steam название и небольшая картинка — это всё, чем может привлечь к себе игра. На ранних этапах цифрового маркетинга существовало гораздо меньшее количество выпущенных игр. Увеличившийся вал выпускаемых игр с уменьшившимся маркетинговым пространством делают название важным, как никогда.

Кроме того, следует рассмотреть множество других аспектов. Маркетинг «сарафанного радио», места в поисковых движках, возможность перепутать игру с другими и многое другое — вот причины, по которым стоит вложить дополнительные усилия, чтобы обеспечить названию игры «защиту от дурака».

Ну а теперь перейдём к данным.

Весь объём статистики

Для сбора статистики мы проанализировали 5 820 игр, выпущенных в прошлом году (без учёта free-to-play). Мы рассматривали только уникальные игры, выпущенные как отдельные продукты, поэтому из набора данных были исключены DLC и прочие расширения. После графиков следует краткое описание данных и методов.

Длина названия

Для 5 820 проанализированных игр средняя длина названия равна 17,15 со стандартным отклонением 10,26. То есть в целом, длина названий игр, выпущенных в прошлом году, находилась в пределах от 7 до 27 символов, не считая выбросов.

Среднее название состояло из 2,8 слов с отклонением 1,7, что даёт общий интервал от 1 до 5 слов.

Это демонстрирует общую тенденцию к более лаконичным названиям, что позволяет нам выбрать один из вариантов: следовать тенденции или намеренно избегать её. У обоих подходов при текущем состоянии рынка есть свои преимущества, и их нужно тщательно проанализировать при выборе собственного названия.

Кроме интервалов длины в символах и словах, многие из проанализированных игр демонстрируют похожие структуры наименования. С самых первых этапов анализа было меньше двух дюжин структур названий, в которые попадал больше 90% игр. Примечательно, что самыми распространёнными структурами названий были "{существительное} of {существительное}" и "{существительное}: {прилагательное} {существительное}" (например, «West of Loathing» и «Divinity: Original Sin 2»).

Названия из нескольких частей

15,14% игр из всего набора данных имели название из нескольких частей. При анализе название считалось состоящим из нескольких частей, когда в нём присутствовал один из следующих символов: ":", "-" и "|", который при этом создавал два отдельных фрагмента информации. Например, «Yooka-Laylee» не считается состоящим из нескольких частей, а «Steel Division: Normandy 44» считается.

Использование уникальных слов

Один из самых важных аспектов собранных данных заключался в использовании «уникальных слов» в названии игры. В целях анализа слово считается уникальным, если оно не существует как словарное определение в десяти наиболее популярных языках, используемых игроками Steam. В целом, уникальное слово в названии содержали 27,93% игр.

Отсылки к другой интеллектуальной собственности

Обыскав наш набор данных на предмет отсылок к другой интеллектуальной собственности (Intellectual Properties, IP), мы получили новое подмножество, требующее дальнейшего анализа. 11,96% игр в наборе данных в той или иной степени ссылались на уже существующую IP (предыдущую игру, фильм, книгу или другие медиа).

Если использовать это подмножество для дальнейших исследований, чтобы найти взаимосвязи между сиквелами игр, играми на основе фильмов и книг, то можно создать собственный интересный проект, если кому-то это будет интересно.

Оцениваем лучших

Давайте посмотрим, как эти игры соотносятся с бестселлерами. Взяв верхние 10% игр и сравнив их с общим набором данных, мы сможем создать чёткую картинку того, что важно в названиях видеоигр.

Сравнение длин названий

Лучшие по продажам 10% игр, выпущенные в прошлом году, имеют среднюю длину названия 17,63 символов. По сравнению с 17,15 общего набора данных, можно сказать, что у бестселлеров в среднем немного более длинные названия.

Вычисление среднего длин названий в словах показывает похожие результаты. Названия лучших игр состоят в среднем из 2,92 слов, (2,8 слова в полном наборе данных). Этого достаточно, чтобы показать, что лучшие игры склонны к большей многословности.

Названия из нескольких частей

19,17% игр из лучших по продажам 10% имеют названия из нескольких частей (15,14% в полном наборе данных). Разница в этих двух значениях. показывает, что может быть выгоднее использовать более длинные названия. Возможно, так происходит из-за более оптимального использования ограниченного пространства, в котором разработчики могут привлечь потенциальных игроков.

Использование уникальных слов

Что касается использования уникальных слов, то бестселлеры отличаются разительно! В 48,19% названий используется хотя бы одно уникальное слово (в общем массиве данных таких игр всего 27,93%). Это огромная разница в данных; она предполагает, что использование уникальных слов делает игру более запоминающейся, или с большей вероятностью привлекает возможного покупателя.

Отсылки к другой интеллектуальной собственности

Лучшие по продажам игры содержали отсылки к другим видеоиграм, фильмам и книгам в 20,73% случаев — почти в два раза больше, чем показатель всего набора данных (11,96%). Это демонстрирует чёткую тенденцию к тому, что расширения существующих игр обычно показывают себя лучше, или, по крайней мере, имеют больший шанс на успех.

Наборы данных, источники и техники анализа

Использованный в этой статье массив данных полностью получен через SteamSpy и официальный Steam Web API. Если вы хотите провести собственные исследования или попробовать другие алгоритмы, то лучше всего начинать с этих источников.

При считывании данных учитывайте, что ограничения наборов данных и методов анализа могут оставлять пробелы, которые способны влиять на результаты. Например, существуют неустранимые проблемы, такие, как влияние бесплатной раздачи игр на данные продаж и игры с продажами, близкими к статистической погрешности.

Хотя эти данные всё равно полезны, такие проблемы тяжело контролировать.

Интерпретация данных: что всё это значит?

Мы обработали множество данных, но что они значат конкретно для вас? Вот самые чёткие из обнаруженных нами тенденций:

Составляйте названия из 1-5 слов

Большинство игр находятся в этом интервале, а показавшие наилучшие результаты попадают в интервал 3-4 слов. Постарайтесь внимательно подбирать слова и делайте как можно более подробное описание в этом ограниченном пространстве. Если вы уже нашли идеальное название, и оно немного короче (1 слово) или немного длиннее (6-8 слов), то не волнуйтесь — небольшие вариации — это неплохо.

Названия из нескольких частей привлекают больший интерес

Игроки обычно предпочитают названия из нескольких частей. Скорее всего, причина заключается в том, что они позволяют передать больше информации в ограниченном пространстве. Хорошим планом будет использование названия из нескольких частей, вызывающее дополнительные эмоции или содержащее описание.

Название должно быть уникальным и интересным

Названия с несловарными словами с большей вероятностью имеют хорошие результаты, поэтому нечто уникальное в названии позволяет ему выделиться из списка стандартных названий.

Сиквелы и франшизы продаются лучше

Если основать игру на уже существующей работе, то вы получите больший шанс на успех. Причина этого, скорее всего, заключается в том, что игроки знакомы с предыдущей IP. Но это и хорошая новость для инди-разработчиков, которые хотят превратить один проект в серию игр.

Дальнейшие исследования для любителей данных

Хотите поднять исследования на новый уровень? Вот два способа, которыми можно расширить выполненный анализ и получить более глубокие результаты.

Разбейте подмножества IP

Мы немного обсудили процент игр, ссылающихся на уже существующую интеллектуальную собственность, но это подмножество само по себе может содержать интересные данных. Сколько игр ссылается на предыдущие игры? Фильмы? Книги? Ещё одной интересной линией исследований может быть сравнение результатов разных игр в серии. Например, были ли четвёртые игры так же успешны, как и третьи?

А как насчёт самых плохих игр?

Мы сравнили лучше 10% игр с общим массивом данных, но как насчёт худших 10%? Сегментирование этой части данных может привести к интересным новым открытиям, особенно в том, каких названий стоит избегать.

Теги
Показать больше

Похожие статьи

Кнопка «Наверх»
Закрыть