Становимся специалистами по Tableau Desktop – Часть 4. Дискретные и непрерывные, агрегированные и деагрегированные.
Дискретный против непрерывного
Зеленые и синие таблетки
Прежде всего, я хочу прояснить недоразумение, относительно того, что зеленые таблетки указывают меры, а синие – измерения. Дело в том, что зеленые таблетки обозначают непрерывные переменные, а синие таблетки – дискретные. Путаница вызвана настройкой Tableau по умолчанию, согласно которой мера классифицируется как непрерывная, а измерение – как дискретное. Но вы можете преобразовать каждое дискретное (числовое) измерение в непрерывное измерение, а каждую меру – в дискретную меру.
Итак, теперь мы знаем правильное значение цветов и, кроме того, таблетки меры могут быть зеленого и синего цвета, а это означает, что мера может быть непрерывной и дискретной. То же относится и к числовым измерениям.
Непрерывные и дискретные даты
Самый впечатляющий пример – переменная даты. Если вы установите свою дату как дискретную, то создадите заголовки, которые можно сортировать. Если вы переключитесь на непрерывный режим, то создадите ось, которая сортирует даты в хронологическом порядке. (Обратите внимание на цвет таблеток в этом примере!)
Дискретный и непрерывный в Tableau
Что касается прошлой недели, и месяца (MONTH) (Дата заказа) – это измерение в представлении, независимая переменная. На первом графике у нас есть дискретное измерение, сумма прибыли вычисляется для каждого месяца за все годы. Второй график вычисляет сумму прибыли за каждый месяц каждого года для непрерывного измерения. Если вы щелкнете по заголовку внизу первого графика, то сможете просто отформатировать заголовки. На втором графике вы можете отформатировать и отредактировать ось.
Что касается разницы между дискретным и непрерывным, мне очень понравилось такое объяснение на веб-сайте Tableau:
«Непрерывный означает формирование непрерывного целого без перерывов; дискретные средства индивидуально разделены».
Источники:
- Синие и зеленые таблетки – что они означают? от Тимоти Мэннинг
- Основы Tableau: дискретный или непрерывный? от Райана Слипера
- Таблетки в Tableau: непрерывные и дискретные, от Майкла Тредвелла
Надеюсь, что вы получили хорошее представление о «дискретном и непрерывном», поэтому теперь мы можем перейти к «агрегированному и деагрегированному».
Агрегированное и деагрегированное
Руководство по подготовке к экзамену хочет, чтобы мы знали, почему Tableau агрегирует меры. Это хороший вопрос. Многие веб-сайты объясняют, что по умолчанию Tableau агрегирует показатели, но не упоминают почему. К счастью, я нашел обсуждение на форуме сообщества Tableau.
Почему Tableau агрегирует по умолчанию?
Позвольте мне обобщить ответы из ветки для вас. Одним из аргументов такой: меры в большинстве случаев являются более значимыми, когда они являются совокупностью. Лей Чен иллюстрирует это следующим примером:
В чем разница между этими двумя графиками? На первом графике у нас есть сумма продаж и только одна отметка в представлении:
Для второго графика я снял флажок «Aggregate Measures» (Совокупные показатели) в разделе «Analysis» (Анализ)…
... и получить одну оценку за каждую запись в моем источнике данных.
Другой ответ дал Махфудж Хан. Он объяснил, что меры будут агрегатами, потому что они являются зависимыми переменными. Это ссылка на то, что мы узнали на прошлой неделе о мерах и измерениях. В большинстве случаев измерение является независимой переменной и определяет уровень детализации в визуализации. Это также означает, что он устанавливает уровень агрегации.
В нашем первом примере у нас были только продажи, если теперь мы добавим, например, «Segment» (Сегмент) к представлению, то получим три столбца или три отметки, по одной для каждого элемента измерения «Segment» (Сегмент):
Другими словами: больше измерений создает больше детализации и вызывает меньше агрегации. Снова посмотрите наш пример после ввода Категорий и Подкатегорий. Теперь у нас есть 51 оценка в представлении. (Количество меток в представлении рассчитывается с помощью функции size(); вы также можете увидеть эту информацию в левой нижней части окна.)
Настройка агрегации по умолчанию
Как уже упоминалось ранее, показатели агрегируют по умолчанию. Функция агрегации по умолчанию в большинстве случаев является функцией суммы, но, конечно, есть и другие возможные агрегации. Вспомните вторую статью из этой серии, в которой я говорил об управлении свойствами данных. Это место, где вы также можете определить функцию агрегирования по умолчанию для каждой меры.
Более того, можно агрегировать измерения. Вы можете выбрать между Min, Max, Count и Count (Distinct). В следующем примере я подсчитываю различное количество клиентов для каждого сегмента, категории и подкатегории.
Собираем все вместе
Подводя итог: вы должны знать, что для ваших полей данных существует множество возможных комбинаций. Ваши меры могут быть ...
- …непрерывные и агрегированные
- …дискретные и агрегированные
- …непрерывные и деагрегированные
- …дискретные и деагрегированные
То же самое касается измерений, они также могут быть ...
- …непрерывные и агрегированные
- …дискретные и агрегированные
- …непрерывные и деагрегированные
- …дискретные и деагрегированные
Убедитесь, что вы знаете, какую комбинацию использовать при переносе ваших полей данных в вашу визуализацию.
Подводим итог
Фундаментальные концепции Tableau действительно важны. Я много читал об этом, но для меня все встало на свои места только после просмотра бесплатного обучающего видео с сайта Tableau, где они указали, что...
«То, как Tableau считает, зависит от агрегации данных, поэтому зависит от степени детализации представления».