Хабрахабр

[Перевод] Худшая диаграмма на свете

Всем привет!

Сегодня посмотрим на одну интересную заметку о визуализации вывода данных. А мы тут запускаем очередной поток курса «Разработчик JavaScript» и, по рекомендации преподавателей, готовим интересные материалы для чтения.

Поехали.

Круговая диаграмма — самый ужасный способ передачи информации, когда-либо изобретенный за всю историю визуализации данных.

Но ни один из них не обладает популярностью и доверием в той же степени, что и круговая диаграмма. Конечно, существуют и более неудобные методы.

Давайте, я объясню, что с ней не так, и почему вам необходимо перестать использовать ее как можно скорее.

Сперва, поговорим о том, зачем мы вообще используем диаграммы:

  • Диаграммы — способ взять некую информацию и сделать ее более понятной.
  • В целом, задача диаграмм — упростить сравнение разных сетов данных.
  • Чем больше информации диаграмма способна передать без увеличения сложности, тем лучше.

Я покажу, как круговая диаграмма терпит неудачу по всем эти критериям. “Задача” круговой диаграммы — показать взаимоотношения частей и целого.

Посмотрите на эти три круговые диаграммы. Посмотрим, насколько плохо она справляется с единственной задачей, для которой она якобы создана. Предположим, они отражают распределение голосов на местных выборах между пятью кандидатами в трех разных интервалах наблюдения A, B и C:


Открытый источник/ Wikipedia

Поскольку эти доли голосов, которые получил каждый из кандидатов, читателю должно быть легко понять, что происходит в гонке. Итак, что мы можем извлечь из этой информации? Показывает ли кандидат 5 лучшие результаты, чем кандидат 3? Но это не так. У кого в гонке наибольший моментум?
Так если задача — сделать информацию проще для понимания, насколько вам помогли эти диаграммы? Кто показал лучший результат за время A и B — кандидат 2 или кандидат 4? Действительно, если бы я просто дал вам таблицу со значениями голосов, не было бы это проще для восприятия информации?

Но пока посмотрим на ту же самую информацию, представленную в виде гистограммы:

Мы с первого взгляда можем понять, что именно происходит с каждым из кандидатов в каждый промежуток времени гонки. Теперь гораздо понятнее. Эта гистограмма гораздо четче выделяет части целого, чем круговая диаграмма, несмотря на то что это ее основная задача.

Посмотрим теперь на другой недостаток круговой диаграммы, который связан с тем, что люди на самом деле не понимают круги.

Ниже изображена круговая диаграмма с распределением партий Европейского парламента:

Если единственное, что мы пытаемся узнать, что EPP больше, чем S&D, то какой смысл в диаграмме? Основной вопрос — можем ли мы сравнить доли, чтобы выявить различия размеров всех частей диаграммы? Нет, диаграмма полезна только в том случае, если мы можем сравнить все ее элементы друг с другом.
Ниже представлены отдельные доли, для сравнения вырванные из контекста. Я мог бы понять это, просто посмотрев на два числа. Посмотрите на них, и подумайте, можете ли вы расставить их по порядку от наибольшего к наименьшему.

Люди вообще плохо умеют сравнивать доли круга, когда речь идет о размере.
Именно поэтому вы могли считать тригонометрию и радианы гораздо сложнее обычной геометрии прямоугольников.

Вот те же данные, но в виде столбчатой диаграммы: Это не плохо, но такое стоит иметь в виду, когда пытаетесь сформулировать информацию наиболее исчерпывающим и доступным способом.

Сейчас же вы можете посмотреть, сколько мест отведено каждой из партий — такой информации изначально не было представлено на круговой диаграмме. Обратите внимание, что вы можете сравнить каждую партию с любой другой партией.
Просто сравнивните длины прямоугольников, чтобы понять, что происходит.
При большом желании, вы могли бы заменить левую ось на проценты, чтобы узнать распределения внутри парламента.

А теперь, посмотрим, как легко можно манипулировать круговыми диаграммами.
Вот те же самые данные, что и выше, но теперь в виде 3D Круговой Диаграммы:

Взгляните на диаграмму, S&D — красная партия — выглядит примерно равной партии EPP сине-зеленого цвета. Люди постоянно этим пользуются, потому что трехмерная круговая диаграмма, расположенная под углом — отличный способ обмануть вас. На самом деле, 10% мужчин, читающих эту статью, даже не поймут, о чем идет речь. Но такое впечатление создается лишь потому, что я исказил перспективу, создав впечатление, что красный большой.
Это настолько просто, что даже немного стыдно, что Excel позволяет делать такое.
Ниже представлен еще один пример недостатка круговой диаграммы.


Красно-зеленый дальтонизм у мужчин

Чтобы донести мысль, посторонние числа не требуются. Самые элегантные диаграммы не требуют маркировки данных. А если требуются, вы используете не ту диаграмму.

Итак, сделаем выводы:

  • Если в представленной информации есть доли схожих размеров, круговая диаграмма — неподходящий выбор.
  • Если результатов наблюдений несколько (3 и более), круговая диаграмма — неподходящий выбор.
  • Круговой диаграммой можно с легкостью злоупотреблять.
  • Круговая диаграмма — неподходящий выбор, если вам нужно маркировать каждый процент.

Перед тем как перейти к финальной критике круговых диаграмм, посмотрим, в чем же они все-таки хороши. Единственная ситуация, в которой круговые диаграммы хороши — сравнение 2-3 результатов наблюдений с очень различающимся количеством информации.


Business Insider, данные из Детройта
Оплаченные и неоплаченные налоги на недвижимость в Детройте, 2011

И все.

Единственная задача диаграммы выше — показать, как выглядит 32 из 100. То есть, если подумать, единственное, в чем они хороши, единственный способ использования — показать людям, как выглядят доли.

Этот выпад широко распространился. На прошлой неделе я прокомментировал, что круговая диаграмма — это Nickelback от мира визуализации данных. Круговые диаграммы — Аквамен от мира визуализации данных. Но я пришел к выводу, что есть даже более подходящая метафора.

Даже так, другие супергерои DC зачастую могут выполнить работу Аквамена лучше, чем он сам. Аквамен хорош только в одном. Если будет тонуть нефтяной танкер, кого вы позовете? Супермен задержит дыхание под водой, у Бэтмена просто есть подлодка. Или Супермена? Аквамена? Начинаешь задумываться, зачем вообще пригласили Аквамена.

Просто перестаньте использовать круговые диаграммы. И когда появляется настоящий шанс для Аквамена или круговой диаграммы принести пользу — может вам нужно поговорить с рыбой или объяснить, как выглядит 32% в круге — возникает сомнение, а нужно ли это вовсе. Круговые диаграммы — это Аквамен. Они бесполезны, с ними легко облажаться, и они не справляются с единственной задачей диаграмм — сделать информацию визуально наглядной.

Так что же использовать?

Как твитнул Edward Tufte, дата-сайентист, который подробно писал о неудаче круговой диаграммы:

Для сравнения используйте маленькие таблицы, предложения, но не круговые диаграммы. Пользователи круговых диаграмм заслуживают того же подозрения+скептицизма, что люди, которые путают тся/ться. Edward Tufte (@EdwardTufte)

Как всегда ждём вопросы и комментарии тут или можно зайти на день открытых дверей к Александру.

Теги
Показать больше

Похожие статьи

Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *

Кнопка «Наверх»
Закрыть