Разное

Линейчатая диаграмма: Создание и использование линейчатой диаграммы (гистограммы)—ArcGIS Insights

Содержание

Создание и использование линейчатой диаграммы (гистограммы)—ArcGIS Insights

Линейчатую диаграмму образуют строковые поля по оси Y и числовые поля (или поля доля/отношение) по оси X. Длина каждой линейки соответствует значению определенной категории.

С помощью линейчатых диаграмм можно найти ответы на такие вопросы о данных: Как числовые значения распределены или суммированы по категориям? Как ранжируются данные?

Примеры

Страховая компания изучает типы полисов, которые она предлагает, чтобы сравнить свои предложения с результатами недавно завершенного исследования рынка страхования. Первый шаг обзора – определение общего значения полисов для каждого класса. Для показа суммы общих страховых стоимостей (TIV) для каждого класса полисов можно использовать линейчатую диаграмму.

Показанная выше линейчатая диаграмма содержит сумму значений TIV для каждой категории страховых полисов: страхования автомобилей, нетрудоспособности, собственности и жизни. Если диаграмму упорядочить по возрастанию, можно увидеть ее максимальные и минимальные значения.

Страховая компания особенно заинтересована в расширении своего бизнеса в пяти определенных городах. Поле Subgroup может использоваться для сравнения общей страховой стоимости TIV по каждому классу полисов в городах.

Группированная линейчатая диаграмма наверху отображает распределение подгрупп для каждой категории. Значения Policy Class (классы полисов страхования собственности, жизни, потери трудоспособности и автострахования) разбиты на подгруппы, которые отображаются в виде линеек разного цвета для каждого города, включенного в фильтр карточек.

Создание линейчатой диаграммы

Для создания линейчатой диаграммы выполните следующие шаги:

  1. Выберите один из следующих вариантов данных:
    • Одно или два строковых поля
    • Одно или два строковых поля плюс числовое или поле доля/отношение
  2. Для создания линейчатой диаграммы выполните следующие шаги:
    1. Перетащите выбранные поля в новую карточку.
    2. Наведите курсор над областью размещения Диаграмма.
    3. Перенесите выбранные поля в Линейчатую диаграмму.
Подсказка:

Также можно построить диаграммы с помощью меню Диаграмма над панелью данных или кнопки Тип визуализации на существующей карточке. В меню Диаграммы будут доступны только диаграммы, которые применимы к имеющейся выборке данных. В меню Тип визуализации будут только подходящие варианты визуализаций (карты, диаграммы или таблицы).

Примечания по использованию

Кнопка Опции слоя открывает панель Опции слоя. Вы можете использовать панель Опции слоя для просмотра легенды, изменения опций диаграммы и обновления стиля диаграммы.

Вкладка Легенда используется для просмотра символов на графике. Всплывающая кнопка легенды отобразит легенду как отдельную карточку на вашей странице. Вы можете использовать легенду для создания выборки на диаграмме, если применена подгруппа. Чтобы поменять цвет, связанный со значением, нажмите на символ и выберите на палитре нужный цвет, либо введите его шестизначный код.

Вкладка Символы используется для изменения Типа символа на Уникальный символ и включения или выключения надписей. Вкладка Символы недоступна, если для диаграммы указано поле подгруппы.

Надписи отображают числовые значения, связанные с диаграммой. Для надписей доступны следующие настройки:

  • Десятичные знаки — вы можете выбрать число десятичных знаков для надписей от нуля до пяти, либо выбрать По умолчанию или Авто. По умолчанию будет сокращать большие числа, а Авто будет выбирать подходящую точность.
  • Выравнивание надписей — для диаграмм доступны четыре варианта выравнивания: Горизонтально, извне, Горизонтально, внутри, Вертикально, извне и Вертикально, внутри.
  • Контекстная надпись — к надписи могут быть добавлены символы, такие как значок или единица измерения. Контекстная надпись может быть размещена слева (по умолчанию) или справа от значения.

Вкладка Оформление используется для изменения цвета символа (только единый цвет) и изменения цвета контура диаграммы.

Вы можете отобразить значение каждой линейки как количество объектов в каждой категории по оси y или как значение числового поля или поля доли/отношения. Если используется поле, то значения линеек могут быть вычислены как сумма, минимум, максимум, среднее, процентиль или медиана значений поля для каждой из категорий.

Медиана и процентиль не доступны для некоторых удаленных векторных слоев. Если удаленный векторный слой не поддерживает медиану или процентиль, можно скопировать слой в рабочую книгу.

Дополнительно на оси y может быть выбрано поле Подгруппы. Поле Подгруппы должно быть строковым, и оно используется для разбиения категорий по оси y на подкатегории.

Подсказка:

Вы можете оформить связанные карты с использованием того же поля, которое использовали для группировки значений на линейчатной диаграмме. При работе с диаграммой или с картой вы можете одновременно видеть и категориальные, и пространственные характеристики.

Для отображения среднего, медианного, верхнего квартиля, нижнего квартиля или пользовательского значения используйте кнопку Статистика диаграммы .

Кнопка Сортировать используется для сортировки категорийных данных по числовой переменной либо в возрастающем, либо в убывающем порядке, по алфавиту или вручную. Если вы выбрали Сортировать вручную, вы можете щелкнуть и перетащить столбцы в новое положение на диаграмме. Нажмите Применить, чтобы применить изменения, или Отмена, чтобы вернуться к предыдущему порядку.

Диаграммы на опубликованной странице будут по умолчанию использовать тот же стиль сортировки, который использовался при публикации страницы. Сортировка вручную будет называться Предопределенной, и сортировка вручную будет недоступна для читателей. Диаграммы, которые при публикации были отсортированы по возрастанию, убыванию или в алфавитном порядке, не будут иметь Предопределенной опции сортировки.

Кнопка Тип визуализации выполняет переключение между линейчатой диаграммой и другими типами визуализаций – суммарной таблицей, пузырьковой диаграммой или линейчатой диаграммой.

Используйте кнопку Перевернуть карточку , чтобы посмотреть обратную сторону карточки. Вкладка Информация о карточке предоставляет информацию о данных на карточке, вкладка Экспорт изображения позволяет пользователям экспортировать изображение карточки, а вкладка Экспорт данных позволяет пользователям экспортировать данные с карточки.

При создании линейчатой диаграммы итоговый набор данных с текстовыми и числовыми полями, которые были использованы при ее построении, добавляется на панель данных. Итоговый набор данных можно использовать для поиска ответов в ходе непространственного анализа, который запускается с помощью кнопки Действие .


Отзыв по этому разделу?

Линейчатые диаграммы в отчете с разбивкой на страницы — Microsoft Report Builder & Power BI Report Builder

Twitter LinkedIn Facebook Адрес электронной почты

  • Статья
  • Чтение занимает 3 мин

Применимо к: Microsoft Report Builder (SSRS) Power BI Report Builder конструктор отчетов в SQL Server Data Tools

На линейчатой диаграмме в отчете с разбивкой на страницы ряд отображается в виде наборов горизонтальных линий. Простая линейчатая диаграмма очень напоминает гистограмму, на которой ряд отображается в виде наборов вертикальных линий, и линейчатую диаграмму диапазонов, на которой ряд отображается в виде наборов горизонтальных линий с разными начальными и конечными точками.

Линейчатая диаграмма представляет собой единственный тип диаграммы, на которой данные отображаются горизонтально. Поэтому линейчатые диаграммы часто применяются для представления данных, привязанных ко времени, при условии, что начальная и конечная даты относятся к конечному периоду. Кроме того, линейчатые диаграммы широко применяются для отображения категориальной информации, поскольку для демонстрации категорий может применяться горизонтальное расположение. Дополнительные сведения о добавлении данных в линейчатую диаграмму см. в разделе Диаграммы (построитель отчетов и службы SSRS).

Пример линейчатой диаграммы показан на следующей иллюстрации. Линейчатая диаграмма хорошо подходит для этих данных, поскольку во всех трех рядах совместно используется общий период времени, что позволяет проводить объективные сравнения.

Примечание

Создать и изменить определение для отчета на страницу (RDL-файл) можно с помощью построителя отчетов (Майкрософт), построителя отчетов Power BI и конструктора отчетов в SQL Server Data Tools.

Варианты линейчатых диаграмм

  • С накоплением. Линейчатая диаграмма, на которой несколько рядов наложены вертикально. Если в диаграмме только один ряд, то линейчатая диаграмма с накоплением выглядит точно так же, как обычная линейчатая диаграмма.

  • Процент накопления. Линейчатая диаграмма, на которой несколько рядов наложены вертикально в целях подгонки к 100% области диаграммы. Если на диаграмме представлен только один ряд, то подгонка к 100% области диаграммы проводится применительно ко всем линейкам.

  • Объемная кластеризация. Линейчатая диаграмма, на которой отдельные ряды показаны в отдельных строках в виде трехмерной диаграммы.

  • Объемный цилиндр.

    Линейчатая диаграмма, на которой линейки представлены как цилиндрические столбики в виде трехмерной диаграммы.

Условия применения данных для линейчатых диаграмм

  • В линейчатых диаграммах оси переставлены местами. Осью категорий является вертикальная ось (или «ось Y»), а осью значений — горизонтальная ось (или «ось X»). Это означает, что на линейчатой диаграмме имеется больше места для меток категорий, которые отображаются вдоль оси Y как список, предназначенный для чтения сверху вниз.

  • Линейчатые диаграммы и гистограммы чаще всего используются для сравнения групп. Если на диаграмме представлено больше трех рядов, то лучше воспользоваться линейчатой диаграммой с накоплением или гистограммой. Можно также собрать линейчатые диаграммы с накоплением или гистограммы в несколько групп, если диаграмма содержит несколько рядов.

  • На линейчатой диаграмме значения отображаются слева направо, что позволяет создавать диаграммы, в большей степени доступные для восприятия, если на них должны быть отображены данные, привязанные ко времени.

  • Если требуется ввести линейные графические элементы в таблицу или матрицу в составе отчета, рассмотрите возможность использования линейного датчика вместо линейчатой диаграммы. Линейный датчик предназначен для представления одного значения вместо нескольких групп, поэтому допускает более гибкое использование в области данных списка или таблицы. Дополнительные сведения см. в разделе Датчики (построитель отчетов и службы SSRS).

  • Можно применить специальные стили рисования к отдельным линейкам на линейчатой диаграмме для усиления визуального впечатления. Возможные стили рисования: клин, рельефный, цилиндрический и от светлого к темному. Эти эффекты призваны улучшить внешний вид двумерной диаграммы. Эти стили применимы и к трехмерной диаграмме, но эффект будет несколько другим. Дополнительные сведения о добавлении стиля рисования к линейчатой диаграмме см. в разделе Эффекты диаграммы: добавление багетной рамки, тиснения или текстуры (построитель отчетов и службы SSRS).

  • В линейчатых диаграммах с накоплением ряды размещаются друг над другом, в результате чего создается один bar stack. Предусмотрена также возможность разделения линейчатой диаграммы с накоплением на несколько наборов стеков для каждой категории. Диаграммы групп с накоплением отображаются параллельно. Диаграмма может содержать любое число сгруппированных рядов с накоплением.

  • Когда на линейчатой диаграмме отображаются метки для точек данных, эти метки располагаются за пределами каждой линии. В результате метки могут перекрываться, когда линии занимают все пространство, выделенное внутри области диаграммы. Положение меток для точек данных, отображаемых для каждой линии, можно изменить, установив свойство

    BarLabelStyle на панели «Свойства».

  • Если в наборе данных имеется большое (относительно размеров самой диаграммы) число точек данных, то размеры столбцов или линий, а также расстояния между ними сокращаются. Чтобы вручную установить ширину столбцов диаграммы, нужно изменить их ширину в пикселях, указанную в свойстве PointWidth . По умолчанию это свойство имеет значение 0,8. С увеличением ширины столбцов или линий в диаграмме расстояние между отдельными столбцами или линиями уменьшается.

См. также:

Диаграммы (построитель отчетов и службы SSRS)
Типы диаграмм (построитель отчетов и службы SSRS)
Точки данных со значением NULL и пустые точки в диаграммах (построитель отчетов и службы SSRS)

Гистограммы (построитель отчетов и службы SSRS)
Диаграммы диапазонов (построитель отчетов и службы SSRS)
Форматирование цветов для рядов на диаграмме (построитель отчетов и службы SSRS)
Форматирование меток оси на диаграмме (построитель отчетов и службы SSRS)
Форматирование условных обозначений на диаграмме (построитель отчетов и службы SSRS)
Добавление в диаграмму стилей рельефа, приподнятости и текстуры (построитель отчетов и службы SSRS)
Руководство. Добавление в отчет линейчатой диаграммы (построитель отчетов)
Руководство. Добавление в отчет линейчатой диаграммы

Цены на фьючерсы на зерно — Barchart.

com

Отчет по животноводству Walsh Trading — пятница, 3 февраля, 18:28 CST

Крупный рогатый скот достигает нового максимума, пока кормушки дрейфуют

Цены на пшеницу завершили последний торговый день недели с потерями. Фьючерсы на пшеницу в Чикаго потеряли от 2 1/2 до 4 1/4 цента в предыдущие месяцы в пятницу. Цены KC HRW установились с потерями от 7 1/2 до 8 центов…

ZWh33 : 756-6s (-0,56%)

ZWK23: 768-2S (-0,49%)

ZWPAES.CM: 6,9568 (-0,65%)

KEH33: 873-0 (-0,88%)

KEPAWS.CM: 8.3979.88%)

KEPAWS.CM: 8.3979. %)

МВтч33 : 921-4 с (-0,35%)

Соевый шрот вырос до выходных Barchart – пятница, 3 февраля, 17:14 по центральному поясному времени

масло упало в выходные. Фьючерсы на сою закрылись незначительно в минусе для нового урожая, но от 1 1/2 до 2 1/4 цента…

ZSH33: 1532-0S (-0,15%)

ZSPAUS.CM: 14,9070 (-0,19%)

ZSK23: 1525-4S (-0,15%)

ZSN23: 1516-4S (-0,15%)

ZSN23: 1516-4S4S4S (-0,15%)

: 1516-4. %)

Цены на кукурузу закрылись ростом Barchart – пятница, 3 февраля, 17:14 по центральному поясному времени

Пятничные фьючерсы на кукурузу завершили день ростом на 2 1/4 цента. За неделю мартовская кукуруза была на 5 1/2 цента ниже, но декабрьская кукуруза подорожала на 8 3/4 цента. Скидка на новый урожай 81 1/2 цента…

ZCh33 : 677-4с (+0,33%)

ZCPAUS.CM : 6,8043 (+0,33%)

ZCK23 : 675-4с (+0,26%)

+ 6,2-6% ZCN )

Shootin’ the Bull о работе Swift Trading Company — пятница, 3 февраля, 15:18 по центральному поясному времени

По моему мнению, разрыв между реальностью и оптимизмом продолжает расти. На этой неделе преобладает оптимизм, поскольку фьючерсы на жиры и кормовые добавки выросли. Реальность, казалось бы, просто сидит на месте….

Нет Быка | Seeing Double NO BULL — пятница, 3 февраля, 13:23 CST

Вчера в школе Трипп оделся как литературный персонаж. Он решил перепрофилировать (гигантскую) комбинированную коробку Case IH ко Дню святого Валентина, которую он сконструировал в прошлом году, и надеть нагрудники и фланель…

ZCh33 : 677-4s (+0,33%)

Цены на пшеницу снижаются в пятницу Barchart — Пятница, 3 февраля, 11:53 CST

Полуденный рынок пшеницы пока работает в минусе, но цены уже не достигли своих минимумов. В полдень фьючерсы на CBT SRW снижаются на 4-5 центов. Цены KC пока работают на 7 центов в минусе. Фьючерсы на яровую пшеницу…

ZWH33: 756-6S (-0,56%)

ZWK23: 768-2S (-0,49%)

ZWPAES.CM: 6.9568 (-0,65%)

KEH33: 873-0S (-0,65%)

: 873-0 (-0,65%)

: 873-0 (-0,65%)

: 873-0 (-0,65%) %)

KEPAWS.CM : 8,3979 (-0,85%)

MWh33 : 921-4s (-0,35%)

Red Beans в полдень Barchart — пятница, 3 февраля, 11:53 CST

90 в минусе до полудня с потерями от 2 1/4 до 3 1/2 цента. Фьючерсы на продукты питания продолжают расти, снова фиксируя новые максимумы LoC для пятницы. Цены на BO пока на три цифры ниже для…

ZSH33: 1532-0S (-0,15%)

ZSPAUS.CM: 14,9070 (-0,19%)

ZSK23: 1525-4S (-0,15%)

ZSN23: 1516-4S (-0,15%)

ZSN23: 1516-4S4S4S (-0,15%)

: 1516-4. %)

Кукуруза в полдень работает выше гистограммы — пятница, 3 февраля, 11:52 по центральному поясному времени

Цены на кукурузу торгуются с небольшим повышением на 1 1/2 цента до полудня после скачка вперед и назад, который удерживал март на уровне 8 1/2 цента. диапазон. Национальный еженедельный отчет Министерства сельского хозяйства США по этанолу показал, что кукурузное масло…

ZCh33 : 677-4с (+0,33%)

ZCPAUS.CM : 6,8043 (+0,33%)

ZCK23 : 675-4с (+0,26%)

+ ZCN4-6 %

День безработицы. Отчет о кукурузе и этаноле 03.02.2023 The PRICE Futures Group — пятница, 3 февраля, 10:12 утра по центральному поясному времени

У нас есть номер безработицы, который поднимает свою уродливую голову в этой экономике, которая уже подняла свою уродливую голову. Будут ли технические увольнения отображаться в этом числе. По мере того, как мы вступаем в новый избирательный цикл…

Полное руководство по линейчатым диаграммам

Гистограмма является одним из самых основных типов диаграмм и одним из наиболее полезных инструментов для изучения и понимания данных.

Что такое гистограмма?

Гистограмма (также известная как гистограмма, столбчатая диаграмма) отображает числовые значения уровней категориального признака в виде столбцов. Уровни нанесены на одну ось графика, а значения нанесены на другую ось. Каждое категориальное значение претендует на одну полосу, а длина каждой полосы соответствует значению полосы. Столбцы нанесены на общую базовую линию, чтобы упростить сравнение значений.

В этом примере гистограммы показано количество покупок, сделанных на сайте различными типами пользователей. Категориальная функция, тип пользователя, нанесена на горизонтальную ось, а высота каждого столбца соответствует количеству покупок, сделанных под каждым типом пользователя. На этой диаграмме видно, что хотя количество покупок от новых пользователей, которые создают учетные записи пользователей, примерно в три раза больше, чем от тех, кто не создает учетные записи пользователей (гостей), и те, и другие затмеваются количеством покупок, сделанных повторными пользователями.

Когда следует использовать гистограмму

Гистограмма используется, когда вы хотите показать распределение точек данных или выполнить сравнение значений метрик по различным подгруппам ваших данных. Из гистограммы мы можем увидеть, какие группы самые высокие или наиболее распространенные, и как другие группы сравниваются с другими. Поскольку это довольно распространенная задача, гистограммы являются довольно распространенным типом диаграмм.

Первичной переменной гистограммы является ее категориальная переменная. Категориальная переменная принимает дискретные значения, которые можно рассматривать как метки. Примеры включают штат или страну, тип отрасли, метод доступа к веб-сайту (настольный компьютер, мобильный телефон) и тип посетителя (бесплатный, базовый, премиум). Некоторые категориальные переменные имеют упорядоченные значения, например, деление объектов по размеру (маленький, средний, большой). Кроме того, некоторые некатегориальные переменные могут быть преобразованы в группы, например, агрегирование временных данных на основе даты (например, деление по кварталам на 20XX-Q1, 20XX-Q2, 20XX-Q3, 20XX-Q4 и т. д.). Важный момент для этой первичной переменной является то, что группы различны.

В отличие от этого, вторичная переменная будет числовой по своей природе. Значения вторичной переменной определяют длину каждого бара. Эти значения могут поступать из самых разных источников. В своей простейшей форме значения могут быть простым подсчетом частоты или пропорцией того, какая часть данных разделена на каждую категорию, а вовсе не фактической характеристикой данных. Например, на следующем графике подсчитываются просмотры страниц за шесть месяцев. Из этой визуализации видно, что в июне и июле был небольшой пик, прежде чем вернуться к предыдущему базовому уровню.

В других случаях значения могут быть средними, общими или каким-либо другим суммарным показателем, вычисляемым отдельно для каждой группы. В следующем примере высота каждого столбца соответствует среднему размеру транзакции в зависимости от способа оплаты. Обратите внимание, что, хотя средние платежи выше всего при использовании чеков, потребуется другой график, чтобы показать, как часто клиенты фактически используют их.

Пример структуры данных

Тип платежа Средняя транзакция
Чек 46.861
Кредитная карта 36.681
Дебетовая карта 28.860
Цифровой бумажник 18.900
Наличные 4.802

Данные, представленные в виде гистограммы, могут быть представлены в компактной форме, такой как приведенная выше таблица, с одним столбцом для категорий и вторым столбцом для их значений. В других случаях данные могут поступать в неагрегированной форме, как в приведенном ниже фрагменте таблицы, при этом инструмент визуализации автоматически выполняет агрегацию во время создания визуализации.

Для гистограммы на основе подсчета необходим только первый столбец. Для линейчатой ​​диаграммы на основе сводки сгруппируйте по первому столбцу, а затем вычислите суммарную меру по второму столбцу.

Рекомендации по использованию гистограмм

Использование общей базовой линии с нулевым значением

Прежде всего, убедитесь, что все ваши гистограммы строятся относительно базовой линии с нулевым значением. Эта базовая линия не только облегчает читателям сравнение длины столбцов, но и поддерживает достоверность визуализации ваших данных. Столбчатая диаграмма с ненулевой базовой линией или каким-либо другим пробелом в шкале оси может легко исказить сравнение между группами, поскольку соотношение длин столбцов не будет соответствовать соотношению фактических значений столбцов.

Если отрезать 90 точек от вертикальной оси, можно преувеличить небольшую разницу в 4 точки, чтобы она выглядела как соотношение 1:3.
Сохраняйте прямоугольные формы для ваших стержней

Еще одним важным запретом является возиться с формой стержней для построения. Некоторые инструменты позволяют закруглить заглушки стержней, а не просто иметь прямые края. Это округление означает, что читателю сложно сказать, где считать фактическое значение: сверху полукруга или где-то посередине? Небольшое закругление углов может быть допустимым, но убедитесь, что каждый столбец достаточно плоский, чтобы определить его истинное значение и обеспечить легкое сравнение между столбцами.

Точно так же вам следует избегать использования трехмерных эффектов на полосах. Как и в случае сильного округления, это может затруднить понимание того, как измерять длину стержня, и, в качестве бонуса, может привести к тому, что базовые линии не будут выровнены (см. Пункт выше).

Рассмотрите порядок уровней категорий

Одно из соображений, которое вы должны учитывать при составлении гистограммы, — это порядок, в котором вы будете строить столбцы. Стандартное соглашение состоит в том, чтобы сортировать столбцы от самых длинных до самых коротких: хотя всегда можно сравнивать длины столбцов независимо от порядка, это может уменьшить нагрузку на читателя, который должен самостоятельно проводить эти сравнения. Основное исключение из этого правила — если метки категорий каким-то образом упорядочены по своей природе. В подобных случаях приоритет обычно имеет внутренний порядок.

Коды районов не упорядочены по своей сути, поэтому лучше отсортировать их по значению.
Используйте цвет с умом

Еще одно соображение касается того, как вы должны использовать цвет в гистограммах. Некоторые инструменты по умолчанию окрашивают каждую полосу по-разному, но это может отвлечь читателя, подразумевая дополнительное значение там, где его нет. Наоборот, цвет следует использовать целенаправленно. Например, вы можете использовать цвет, чтобы выделить определенные столбцы для повествования. Цвета также можно использовать, если они имеют значение для публикуемых категорий (например, чтобы соответствовать цветам компании или команды).

Цвета радуги слева не добавляют ничего значимого к трактовке сюжета. С правой стороны большинство столбцов имеют нейтральный серый цвет, чтобы подчеркнуть сравнение двух цветных столбцов.

Распространенное неправильное использование

Замена столбцов изображениями

Может возникнуть соблазн заменить столбцы изображениями, изображающими измеряемые величины (например, мешки с деньгами вместо денежных сумм), будьте осторожны, чтобы не исказить свои данные таким образом. Если ваш выбор символа масштабирует как ширину, так и высоту в зависимости от значения, различия будут выглядеть намного больше, чем они есть на самом деле, поскольку люди в конечном итоге будут сравнивать площади полос, а не только их ширину или высоту. В приведенном ниже примере наблюдается рост загрузок на 58% с 2018 по 2019 год.. Однако этот рост преувеличен при представлении на основе значков, поскольку площадь поверхности значка 2019 года более чем в 2,5 раза превышает размер значка 2018 года.

Если вы чувствуете необходимость использовать значки для отображения значения, то лучше, хотя и не очень хорошо, использовать вместо этого тип диаграммы с пиктограммой . На диаграмме с пиктограммами значение каждой категории обозначается серией значков, каждый из которых представляет определенное количество. В некотором смысле это похоже на изменение текстуры соответствующего бара на повторяющееся изображение. Одним из основных предостережений при использовании этого типа диаграммы является то, что он может затруднить чтение значений, поскольку читатель должен выполнить некоторые математические вычисления в уме, чтобы оценить относительные значения каждой категории.

Общие параметры гистограммы

Горизонтальные столбцы и вертикальные столбцы

Обычный вариант гистограммы заключается в том, должна ли гистограмма быть ориентирована вертикально (с категориями на горизонтальной оси) или горизонтально (с категориями на вертикальной оси). ось). Хотя вертикальная гистограмма обычно используется по умолчанию, рекомендуется использовать горизонтальную гистограмму, когда вы сталкиваетесь с длинными метками категорий. На вертикальной диаграмме эти метки могут перекрываться, и их нужно будет поворачивать или сдвигать, чтобы они оставались разборчивыми; горизонтальная ориентация позволяет избежать этой проблемы.

Если бы столбцы из предыдущего примера были ориентированы вертикально, метки деления команды нужно было бы повернуть, чтобы их можно было прочитать.
Включить аннотации значений

Обычным дополнением к линейчатым диаграммам являются аннотации значений. Хотя читателям довольно легко сравнивать длины столбцов и измерять приблизительные значения по столбчатой ​​диаграмме, точные значения не обязательно легко указать. Аннотации могут сообщать об этих значениях там, где они важны, и обычно размещаются в середине полосы или на ее концах.

Включить усы изменчивости

Когда числовые значения являются сводной мерой, часто возникает вопрос о том, следует ли включать в график планки погрешностей. Столбики погрешностей — это дополнительные усы, добавленные к концу каждого столбца, чтобы указать изменчивость отдельных точек данных, которые повлияли на итоговый показатель. Поскольку существует множество вариантов измерения неопределенности (например, стандартное отклонение, доверительный интервал, межквартильный диапазон), важно, чтобы при отображении планок погрешностей вы отмечали в аннотации или комментировали, что представляют собой планки погрешностей.

В качестве альтернативы вы можете отобразить дисперсию внутри каждой категории с помощью другого типа диаграммы, например, в виде коробчатой ​​диаграммы или диаграммы для скрипки. Хотя эти графики будут содержать больше элементов для анализа читателем, они обеспечивают более глубокое понимание распределения значений в каждой группе.

Столбики погрешностей показывают стандартное отклонение сумм транзакций для каждого типа платежа. Изменчивость ниже для кредитных и дебетовых карт по сравнению с другими.
Диаграмма леденцов

Одним из вариантов гистограммы является диаграмма леденцов. Он представляет точно ту же информацию, что и столбчатая диаграмма, но с другой эстетикой. Вместо столбцов у нас есть линии, увенчанные точками на концах. Леденческая диаграмма наиболее полезна, когда категорий много и их значения довольно близки друг к другу. Изменяя эстетическую форму нанесенных на график значений, можно сделать диаграмму более удобной для чтения.

Круговая диаграмма

Если значения в гистограмме представляют собой части целого (сумма длин столбцов составляет общее количество точек данных или 100 %), то альтернативным типом диаграммы, которую вы можете использовать, является круговая диаграмма. Несмотря на то, что круговую диаграмму часто ругают, она по-прежнему заполняет нишу, когда на ней мало категорий, а разделение частей на целое должно быть в центре внимания. Тем не менее, в общем случае вы, скорее всего, будете использовать столбчатую диаграмму для общего использования, так как легче проводить сравнения между категориями.

Гистограмма

Гистограммы являются близким родственником гистограмм, отображающих значения частоты. В то время как основная переменная гистограммы является категориальной по своей природе, основная переменная гистограммы является непрерывной и числовой. Столбцы на гистограмме обычно располагаются рядом друг с другом, чтобы подчеркнуть этот непрерывный характер: гистограммы обычно имеют некоторое расстояние между столбцами, чтобы подчеркнуть категориальный характер первичной переменной.

Линейный график

Для столбчатых диаграмм, отображающих сводную статистику, линейная диаграмма является ближайшим родственником. Как и отношение гистограммы к гистограмме, основная переменная линейного графика обычно является непрерывной и числовой, что подчеркивается непрерывной линией между точками. Затенение области между линией и нулевой базовой линией создает диаграмму с областями, которую можно рассматривать как комбинацию гистограммы и линейной диаграммы.

Точечный график

В качестве альтернативы, когда у нас есть сводная статистика по категориальной первичной переменной, мы можем выбрать точечный график или точечный график Кливленда вместо гистограммы. Точечный график — это, по сути, линейный график без отрезков, соединяющих каждую точку. Это освобождает его для использования с категориальными уровнями, а не с непрерывным прогрессом. Самое большое преимущество точечной диаграммы по сравнению с гистограммой заключается в том, что значения указываются по положению, а не по длине, поэтому нам не обязательно нужна нулевая базовая линия. Когда необходимая базовая линия на гистограмме мешает восприятию изменений или различий между гистограммами, то линейная диаграмма или точечный график могут быть хорошей альтернативой.

Гистограмма с накоплением и гистограмма с группировкой

Гистограммы можно расширить, введя вторую категориальную переменную, чтобы разделить каждую из групп в исходной категориальной переменной. Если значения столбцов отображают групповые частоты, вторая категориальная переменная может разделить количество каждого столбца на подгруппы. Применительно к исходным столбцам получается столбчатая диаграмма с накоплением, показанная слева на рисунке ниже. В качестве альтернативы, если мы переместим столбцы различных подгрупп к базовой линии, результирующий тип диаграммы будет сгруппированным столбчатым графиком, показанным справа. Мы также используем сгруппированную гистограмму, когда вычисляем статистические сводные показатели по уровням двух категориальных переменных.

Инструменты визуализации

Большинство инструментов, которые могут создавать визуализации, будь то электронные таблицы, библиотеки программирования или инструменты бизнес-аналитики, должны быть способны создавать базовые вертикальные гистограммы. Иногда параметры необходимо проверить или изменить, чтобы следовать рекомендациям. Однако для базовых потребностей исследования данных любого инструмента должно быть достаточно. Другие варианты, такие как горизонтальные полосы, полосы погрешностей и аннотации, не всегда возможны. В частности, вариант диаграммы леденец обычно не считается типом диаграммы по умолчанию и вместо этого обычно требует специальной настройки с помощью программных инструментов.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *