Для чего нужен график области
График области — это специализированная форма линейного графика, где вместо простого соединения точек, данных сплошной линией, мы также заполняем область под этой линией сплошным цветом. Это может показаться незначительным изменением, но оно оказывает серьёзное влияние на то, как мы воспринимаем данные в диаграмме.
Графики области могут быть эффективны для:
- Показателей роста и падения различных рядов данных с течением времени;
- Передачи общих сумм с течением времени,а также некоторых разбивок (но только до определенной точки);
- Подчеркивания отношения части к целому с течением времени,когда одна часть очень велика или меняется с очень большой на очень маленькую;
- Отображения изменений во времени на отдельных панеляхнебольшого многократного графика.
Графики области не являются идеальным выбором для:
- Наборов данных в масштабах, которые не имеют значимого отношения к нулю;
- Отображения нескольких изменчивых наборов данных с течением времени;
- Показателей отличия в значениях.
В этом материале мы поговорим о том, как работает график области, и о некоторых проблемах, которые следует учитывать при рассмотрении вопроса о его создании.
Как работает график области
Графики области выглядят так же, как и обычные линейные, с двумя исключениями:
-
Пространство между осью X и каждой линией на графике заполнено каким-то цветом (возможно, разного оттенка или непрозарчного, в зависимости от предпочтений дизайнера).
-
Ось Х ДОЛЖНА БЫТЬ НУЛЕВОЙ.
Взгляните на график музыкальных продаж в США с течением времени в разбивке по формату:
Когда мы рассматриваем линейные графики, мы сосредотачиваемся на том, как изменяются значения на вертикальной оси: вверх или вниз и т.п. По своей природе линейные графики лучше показывают изменение значений во времени, чем точное количество в каждой измеряемой точке.
Однако, наше восприятие меняется, когда создатель диаграммы добавляет заливку цвета между линией и базовой линией, превращая наш линейный график в график области.
Вместо того чтобы видеть линии, мы видим каждый ряд данных как форму многоугольника; и оцениваем каждую серию данных в меньшей степени по тому, как она меняется со временем, и в большей степени — по восприятию общей цветовой области.
График области преобразовывает цель линейного графика от простого отображения относительного изменения во времени до дополнительного отображения объема или количества.
По этой причине мы не можем использовать шкалы на графиках области, которые не имеют значимого отношения к нулю. Также как и в случае гистограмм, мы должны использовать нулевую базовую линию.
Когда полезны графики области
Графики области довольно заманчиво использовать вместо линейных графиков. Они яркие, привлекательные и достаточно необычные для того, чтобы фактор новизны привлекал зрительское внимание. Однако, как мы обсуждали ранее, линейные графики и графики области не являются взаимозаменяемыми из-за того, как зрители воспринимают различные представления данных.
Мы редко находим идеальные варианты использования для графиков области. Тем не менее, вот несколько случаев, для которых график области может быть приемлемым вариантом.
Отображение нескольких рядов в течение нескольких разных периодов времени, если есть существенные различия между рядами и изменения во времени
Иногда важно показать, как количества менялись с течением времени в нескольких связанных рядах данных. Гистограммы хороши для отображения количества в один момент времени, но несколько рядов по нескольким моментам времени сложно отображать в виде столбцов. График переполняется и громоздится очень быстро.
График области пытается дать ощущение количества во всех точках времени, создавая неправильные многоугольники заполненного цвета. Однако если ряды данных перекрываются, и два (или более) заполнения занимают одно и то же пространство, возникают затруднения при просмотре.
Продолжая использовать тот же пример, что и выше, мы можем внести небольшое изменение в непрозрачность наших «заливочных» цветов, как показано ниже:
При чисто непрозрачном заполнении мы не будем знать, например, сколько кассет было продано до 1983 года или сколько компакт-дисков было продано до 1990 года. До сих пор трудно понять, сколько кассет было продано до 1979 года, потому что три серии перекрываются и серия данных «Кассета» отодвинута еще дальше назад. Этот тип графика также требует, чтобы разработчик сделал лучший выбор в отношении порядка ряда данных.
Отображение нескольких (или десятков) серий, изменяющихся во времени на небольшом множественном графике
Графики области могут быть полезны в небольшой многократной диаграмме (также называемой панельной диаграммой или решетчатой диаграммой). Если у вас есть несколько рядов данных, вместо того, чтобы перекрывать их все на одном графике, вы можете отобразить каждый из них в виде небольшого отдельного графика в регулярной упорядоченной серии похожих диаграмм. Диаграмма области может помочь зрителям сравнить количество и изменение во времени на этих панелях.
Показывает разницу между двумя сериями или между серией и показателем 100%
Они также могут быть полезны, если вы пытаетесь показать разрыв между двумя сериями или между серией и 100%; и этот разрыв является более важным, чем абсолютное значение между линиями. Затенение области между линиями может подчеркнуть этот разрыв.
Каковы некоторые проблемы графиков области
Этот конкретный тип диаграммы сочетает в себе качества таких противоречивых визуальных способов изображения, как диаграммы со сравнением по областям, гистограммы с накоплением (сравнением подкатегорий по категориям) и рассеянные диаграммы, позволяющие скрывать некоторые данные за другими данными. При этом одновременно поощряя использование цвета как категориального дифференциатора вместо инструмента для концентрации внимания. Таким образом, вполне естественно, что у планарных графов есть несколько недостатков.
В большинстве случаев часть вашей информации будет скрыта
Поскольку ваши ряды данных занимают одно и то же пространство на вашем графике, они неизбежно будут перекрываться. Лучший вариант заключается в том, что ваши ряды данных никогда не пересекаются друг с другом, поэтому диаграмма выглядит, как горный массив, где видны все пики. Скорее всего, хотя бы один раз в диаграмме вы увидите, что ряды данных пересекаются друг с другом, и тогда у вас неизбежно будут скрытые данные.
Зрители не всегда могут быть уверены, что каждая серия использует в качестве базового значения
Подобно гистограмме с накоплением, диаграмма с областями накопления содержит подкатегории, которые складываются в общее значение для каждого значения по оси X. Вместо того, чтобы каждый ряд данных сводить к нулю, они накладываются друг на друга.
Согласно данному графику, на сколько миллиардов долларов было продано 8 треков в 1973 году? Более 10 миллиардов долларов или около 3 миллиардов долларов?
Мы не можем сказать точно, так как мы не знаем, укладывает ли данный график все ряды данных друг на друга и т.п.
Если в каждой серии используется общая базовая линия, то наличие полупрозрачных заливочных цветов прояснит этот факт. С другой стороны, диаграмма с областями с накоплением никогда не сможет убедить вас со 100% уверенностью, что на самом деле это диаграмма с областями с накоплением. Так как всегда есть вероятность, что это просто обычная диаграмма с непрозрачными цветами заливки.
Иногда можно видеть вариант графа с накоплением, который называется потоковым графиком. В этой версии вместо линий, складывающихся в одном направлении, они растут вверх и вниз симметрично.
С потоковым графиком меньше шансов, что его ошибочно примут за чистый график площади, но цена этого довольно высока: вы теряете способность видеть мелкие детали, включая помеченную ось y, для облегчения сравнения по годам.
Использование такой диаграммы может привлечь внимание и побудить зрителя взаимодействовать с данными, но для любого реального понимания, вероятно, потребуются дополнительные диаграммы, метки и аннотации.
Сложно дать оценку
Людям сложно давать оценку относительным площадям: насколько больше один круг по сравнению с другим, как сравниваются фрагменты круговых диаграмм или размеры квадратов и прямоугольников, которые не имеют общих базовых линий. На графике площадей мы выполняем еще более сложную задачу — сравниваем области частично затененных неправильных форм. Как вы можете себе представить, это почти невозможно сделать точно.
Например, очень трудно провести визуальное сравнение по годам для любого ряда данных, который не использует нулевой базовый уровень. (На потоковом графике это относится к каждому ряду.) Очевидно ли, что у 8-треков было больше общих продаж, чем загрузок или потоковой передачи? Легко ли видеть, что продажи VInyl и Cassette находятся в пределах 1% друг от друга? Непрерывный и нерегулярный характер границ для каждого региона на диаграмме с накоплением делает эти сравнения еще более сложными.
Больше красок, больше перекрытий, больше хаоса в борьбе за внимание
Наконец, по своей природе, графики области требуют намного больше «чернил», чтобы передать небольшую часть информации. График области с даже одним рядом данных является намного более беспорядочным, чем линейный граф; чем больше серий мы добавляем, тем более загроможденными и трудными для чтения они становятся. Сосредоточить внимание зрителей на одном элементе диаграммы области еще сложнее.
Комментарии (0)