Как создать круговую диаграмму, в которой элементы могут принадлежать нескольким срезам?

Я пытаюсь представить некоторые данные в виде круговой диаграммы. Мои данные структурированы как список кортежей (Season, Int), где integer представляет количество элементов, доступных для определенного сезона.

Трудность состоит в том, что один элемент может быть в несколько сезонов: элемент может быть действительным как для осени, так и для зимы.

Можно ли отображать эту информацию в виде круговой диаграммы? Не понятно, что должен знаменатель при вычислении процентов, потому что сумма счетчиков может быть больше, чем суммарный счет.

В качестве примера, чтобы сделать его более ясным, скажем, у меня есть 10 предметов. Действительным набором данных может быть:

  • (Падение, 4)
  • (Зима, 5)
  • (Лето, 3)
  • (Spring, 10)

Общее количество представленных здесь элементов - 22, но есть только 10 предметов.

Вычисление процента падения как 4 / 10 на самом деле не имеет смысла, но не имеет значения 4 / 22.

Являются ли эти данные просто несовместимыми с круговыми диаграммами (или другими процентно-ориентированными диаграммами)?

Ответ 1

Это зависит от того, какой бизнес-вопрос пытается представить сюжет. Существуют лучшие практики, которые мы используем при визуализации данных. Эти передовые методы руководствуются статистикой и восприятием человеком. Мы хотим, чтобы сюжет сразу рассказывал историю.

Считывая сообщение, кажется, что бизнес-вопрос, на который вы пытаетесь ответить, выглядит следующим образом: Каков процент предметов, доступных в каждом сезоне, относительно общего (общего) количества элементов, которые компания имеет, Используя цифры в вашей почте, 100% предметов доступны в spring, и только 50% предметов доступны зимой.

Это отличный бизнес-вопрос для визуализации (если это действительно бизнес-вопрос, который вы пытаетесь решить), но вы не можете использовать для этого круговую диаграмму. Круговые диаграммы должны представлять 100%. Гистограммы хороши для сравнений, и я рекомендую использовать их. Вы можете сделать единицы оси y равными процентам и иметь 4 бара вдоль оси x.

Бар-диаграммы не должны (статистически) добавлять до 100%, но если вы обеспокоены тем, что люди могут задаваться вопросом об этом, вы можете добиться такого же эффекта, указав ось y подсчета числа в каждом сезоне. Сюжет по-прежнему будет показывать относительное количество предметов, доступных в каждом сезоне. Это еще одна веская причина использовать гистограмму в этом случае.

Наконец, обратите внимание, что круговые диаграммы выглядят хорошо, но они также не рекомендуются с точки зрения восприятия человека. Нам сложно сравнивать относительный размер срезов.