Данные: визуализируй, расскажи, используй. Сторителлинг в аналитике - Коул Нассбаумер Нафлик
Рис. 2.19 Линейчатая диаграмма с накоплением
Диаграмма с областями
Я крайне редко использую диаграммы с областями (area graphs). Человеческий глаз плохо справляется с задачей соотнесения количественных значений с двумерным пространством, и прочесть большинство таких визуализаций сложнее, чем другие типы диаграмм, которые мы обсуждали ранее. Исключение я делаю в одном случае: когда необходимо отразить показатели с большой разницей в значениях. Пространственное измерение области, которая для этого используется (у нее есть ширина и высота, а у столбца – либо высота, либо ширина), обеспечивает более наглядную визуализацию по сравнению с плоскими диаграммами, как показано на рис. 2.20.
Рис. 2.20 Квадратная диаграмма
Другие типы диаграмм
До сих пор я рассказывала о тех типах диаграмм, которые сама применяю чаще всего. Конечно, это не исчерпывающий список, но он может удовлетворить большинство ваших ежедневных потребностей. Прежде чем переходить к новым типам визуализации данных, нужно овладеть базовыми методами.
Есть еще много типов диаграмм. При выборе в первую очередь необходимо убедиться, что диаграмма четко донесет ваше сообщение до аудитории. При использовании плохо знакомого инструмента визуализации вам могут потребоваться дополнительные усилия, чтобы сделать график доступным.
Инфографика
Под инфографикой понимается графическая визуализация информации или данных. Термин часто используется неправильно: им могут обозначать что угодно, от забавных картинок до важной информации. Примеры плохой инфографики включают «кричащие» цифры чересчур крупного размера и «мультяшные» диаграммы. Их яркий внешний вид может привлечь внимание, но требовательный пользователь будет недоволен их низкой информативностью. Такую визуализацию считать инфографикой неправомерно. Но есть много примеров качественной инфографики в области журналистики данных, например в таких изданиях, как New York Times и National Geographic.
Прежде чем приступать к созданию инфографики, необходимо ответить на те же вопросы, которые нужны для понимания контекста сторителлинга на основе данных. Кто ваша аудитория? Что, по вашей задумке, слушатели должны узнать или сделать? Только после этого можно выбрать метод визуализации, который лучше всего донесет информацию до аудитории. Хорошая визуализация – будь то инфографика или любой другой вариант – не просто набор фактов на заданную тему, а хорошо рассказанная история.
Чего лучше избегать
Мы обсудили средства визуализации данных, которые я чаще всего применяю в бизнесе. Есть типы диаграмм и элементы, которых я настоятельно рекомендую избегать: круговые и кольцевые диаграммы, 3D-диаграммы и вспомогательные оси Y. Рассмотрим их подробнее.
Круговые диаграммы – зло
Я не без оснований негативно отношусь к круговым диаграммам. Если коротко, это зло. Чтобы понять, как я пришла к этому выводу, достаточно проанализировать следующий пример.
Рис. 2.21 Круговая диаграмма
Круговая диаграмма на рис. 2.21 (основана на реальном примере) показывает объем доли рынка каждого из четырех поставщиков: A, B, C и D. Изучите данную визуализацию. Как вы думаете, у кого из поставщиков самая большая доля рынка?
Большинство из тех, кому я задавала этот вопрос, сошлись во мнении, что у поставщика В (нижний правый сектор). А какова его доля в процентном соотношении от общего объема рынка?
35%?
40%?
Возможно, вы уже заподозрили подвох. Посмотрите, что получится, если добавить в круговую диаграмму значения сегментов, как показано на рис. 2.22.
Рис. 2.22 Круговая диаграмма с указанием значения сегментов
Объем доли рынка поставщика В (этот сегмент кажется самым большим) составляет 31%, меньше, чем у поставщика А (хотя визуально сегмент поставщика A выглядит меньше).
Проанализируем, что именно препятствует правильной интерпретации данных. Первое, что бросается в глаза (и должно вызвать подозрение у проницательного пользователя), – формат 3D и странная перспектива: кажется, что верхние сегменты расположены дальше. Следовательно, они кажутся меньше. Нижние сегменты расположены ближе, поэтому кажутся больше. О формате 3D мы еще поговорим подробнее, но пока запомните правило: никогда не используйте 3D! Как вы уже увидели, от этого формата нет никакой пользы – только искажение визуального восприятия данных.
Даже если убрать эффект 3D и сделать диаграмму плоской, сложности в ее интерпретации останутся. Глаз человека не слишком эффективно соотносит количественные значения с двумерным пространством. Иными словами, круговые диаграммы сложны для чтения. Когда сегменты примерно одного размера, тяжело (если вообще возможно) определить, какой из них больше, а какой меньше. Когда сегменты разного размера, вы в лучшем случае сможете определить, какой из них больше, а какой меньше, но вряд ли получится сказать, насколько. Для решения этой проблемы можно добавить значения по сегментам. Но даже в этом случае, по моему мнению, такой вид визуализации не заслуживает той популярности, которой сейчас пользуется.
Какова альтернатива? Один из вариантов – заменить круговую диаграмму линейчатой, как показано на рис. 2.23, организовав данные в порядке возрастания или убывания (если у этих категорий нет своего логического порядка, как уже сказано ранее). Помните, что в гистограммах и линейчатых диаграммах человеческий глаз сравнивает крайние точки, а поскольку они выровнены по общей базовой линии, оценить их относительный размер несложно. Для пользователя очевидно не только то, какой сегмент самый большой, например, но и насколько он крупнее, чем остальные.
Рис. 2.23 Альтернатива круговой диаграмме
Может возникнуть вопрос: что теряется при переходе от круговой диаграммы к гистограмме? Уникальность первой – в концепции целого и его частей. Но есть ли толк от этой концепции, если диаграмму сложно прочесть? На рисунке 2.23 я попыталась сохранить эту концепцию, указав, что сумма частей равна 100%. Это не идеальное решение, но его стоит рассмотреть. О том, какие еще существуют альтернативы круговой диаграмме, я расскажу в примере 5 в главе 9.
Когда вы используете круговую диаграмму, остановитесь и спросите себя: зачем? Если вы сможете ответить, значит, вы действительно понимаете, что делаете. В любом случае круговая диаграмма не должна первой приходить вам на ум – с учетом сложностей ее визуального восприятия, которые мы обсудили выше.
Разберем похожий тип диаграммы, который я