6 Принципов Эффективной Визуализации Данных



Ключевые принципы создания полезных и информативных графиков Визуализация данных — важный шаг в процессе понимания науки о данных.

Здесь вы представляете и сообщаете о своих результатах в интуитивно понятном и легком для понимания графическом формате.

Визуализация данных требует большой работы, много работы по очистке и анализу уходит на очистку и превращение грязных данных в красивые графики и диаграммы.

Но даже с подготовленными данными вам все равно придется придерживаться определенных принципов или методологий, чтобы создать полезную и информативную графику.

Однако при написании этой статьи я черпал вдохновение из книги Эдварда Тафта Beautiful Evidence, в которой содержатся шесть принципов того, как сделать диаграммы данных полезными.

Именно эти принципы отличают полезные графики от бесполезных.

Эта статья также во многом вдохновлена книгой Роджера Д.

Пенга «Исследовательский анализ данных в R».

Она доступна бесплатно на Bookdown, и вы можете прочитать ее, чтобы узнать больше об EDA. Давайте подробнее рассмотрим эти принципы.



6 принципов эффективной визуализации данных

Пример визуализации данных на сайте «Наш мир в данных»



1. Показательное сравнение (контрольная и экспериментальная группы)

Демонстрация сравнения является основой хорошего научного исследования.

Доказательства гипотезы всегда связаны с чем-то другим.

Давайте рассмотрим пример: вы говорите: «Темный шоколад улучшает концентрацию и способность к обучению».

Важный вопрос в этом утверждении – «по сравнению с чемЭ» Без сравнения (относительной гипотезы) утверждение бесполезно.

Один из способов показать сравнение – между контрольной и экспериментальной группами.

Люди из одной группы будут есть шоколад, а люди из второй группы — нет. Таким образом, вы можете сравнить влияние шоколада на концентрацию и обучение, основываясь на результатах тестов или измеряя активность мозга.

При создании графиков для представления вашего исследования вы можете построить контрольную и экспериментальную группы, используя прямоугольный график.

Таким образом, читатели получают четкое представление о эффекте эксперимента.

При создании графиков для представления вашего исследования вы можете построить контрольную и лечебную группы, используя ящичную диаграмму.

Таким образом, читатели получают четкое представление о последствиях лечения.



2. Причинность и объяснение

Далее следует объяснение, показывающее причинно-следственную связь при обдумывании вопроса, на который вы пытаетесь ответить.

Если вы показали, что экспериментальная группа оказывает эффект, а контрольная группа — нет, вы должны на основе имеющихся данных сформулировать гипотезу о том, почему это так.

Возвращаясь к предыдущему примеру, скажем, что испытуемые из экспериментальной группы получили более высокие баллы по тесту, который показывает, что темный шоколад улучшает концентрацию внимания.

Важный вопрос: почему это так? Этот вопрос важен, потому что он помогает поднять другие вопросы, которые могут либо опровергнуть, либо поддержать вашу гипотезу на протяжении всего исследования.

Чтобы показать причинно-следственную связь или механизм, вы можете измерить активность мозга контрольной группы и экспериментальной группы и построить график результатов, показав их рядом.

Используя график результатов тестов и график активности мозга, вы увидите причину, по которой испытуемые, принимавшие шоколад, получили более высокие баллы, т. е.

ответ на вопрос, как темный шоколад улучшает когнитивные функции.



3. Данные со многими переменными (более двух переменных)

Реальный мир сложен, и связь между двумя событиями обычно нелинейна.

Итак, в исследовании у вас есть атрибуты или переменные, которые вы можете измерить.

Все эти переменные взаимодействуют друг с другом по-разному.

Некоторые из них могут быть сбивающий с толку , в то время как другие могут быть важными атрибутами, объясняющими, как связаны события.

Как вы уже знаете, корреляция не подразумевает причинно-следственную связь.

Поэтому не стоит ограничивать исследование только двумя переменными: это приводит к ошибочным выводам.

Поэтому вам следует отображать как можно больше данных на своих графиках.

Это может помочь вам выявить любую путаницу в ваших данных.

Давайте Парадокс Симпсона , парадокс в вероятностной статистике, когда «при объединении групп исчезает тенденция, проявляющаяся в разных группах данных».

Проиллюстрировать:

  • Две переменные – отрицательная связь.

  • Три переменные – положительная связь (x, y, z) (есть мешающие переменные).



4. Не позволяйте инструментам управлять вашим анализом

Хороший рассказчик знает, как удержать внимание людей, рассказывая историю продуктивно.

Рассказчик не ограничивается самой историей, но может выразить ее уникальным способом, сочетая разные типы восприятий и включая множество образов, что оживляет историю.

Аналогично, хороший визуализатор данных выходит за рамки имеющихся у вас под рукой инструментов визуализации.

Визуализатор данных имеет возможность переключаться с одной формы выражения (например, линий или кругов) на использование нескольких режимов представления.

Например, вместо создания отчетов, содержащих только текст, используйте инфографику: изображения, диаграммы, слова, цифры и т. д. — все это обогатит информацию.

Благодаря обилию информации и графиков читатели могут наблюдать множество различных корреляций доказательств в одном месте.

Помните, что вы рассказываете историю.

Не позволяйте инструментам ограничивать ваше мышление.

Позвольте анализу управлять инструментами, создавайте потрясающие, богатые фактами графики.



5. Документируйте свои графики с помощью соответствующих меток, шкал и источников данных.

Когда вы впервые смотрите на график, вы сначала видите заголовок, а затем метки контекста графика.

Без них график ничего не говорит. Хорошие отчеты/графики должным образом документированы, каждому графику присвоены соответствующие шкалы и метки.

Источники данных, используемые для создания графиков, также имеют решающее значение.

Таким образом, рекомендуется сохранять код, который использовался для создания данных и графиков: это позволяет воспроизвести данные.

Это также повышает доверие к вашим графикам.

Более того, сохранив код, вы сможете при необходимости отредактировать график.



6. Контент на первом месте

В конечном счете, независимо от всех вышеперечисленных принципов, без качественного, актуального и связного контента ваша графика будет бесполезной или вводящей в заблуждение.

Другими словами, «мусор на входе — мусор на выходе».

Прежде чем сообщать о каком-либо результате, убедитесь, что он является чем-то интересным и важным.

Какой бы красивой и наглядной ни была ваша графика, никому не нужны бесполезные результаты.

Что-то интересное — это личный опыт или что-то, вдохновленное Интернетом.

В любом случае всегда задавайте вопросы: так идея становится реальностью.



Заключение

Визуализация данных — невероятный навык.

Вы можете взять данные и превратить их в красивую графику и истории, которые расскажут людям историю.

В эпоху, когда данные растут в геометрической прогрессии, способность рассказывать историю с помощью данных становится все более важной.

Это лучший момент, чтобы узнать что-то новое.

И краткое изложение принципов:

  1. Покажите сравнение.

  2. Покажите причины.

  3. Показать многомерные данные.

  4. Объедините как можно больше доказательств.

  5. Опишите и задокументируйте график.

  6. Убедитесь, что ваша история интересна.

Больше всего я хочу, чтобы вы вынесли из этой статьи следующее: всегда помните, что нужно начинать с хорошего вопроса, использовать правильный подход и предоставлять только ту информацию, которая необходима для ответа на ваш хороший вопрос.

Оставляю цитату американского математика Джон Тьюки , который открыл новую эру статистики:

Простой график принес аналитику данных больше информации, чем любое устройство.

Для более глубокого понимания этих принципов я рекомендую ознакомиться с книгой Роджера Д.

Пэна «Исследовательский анализ данных в R» (ссылку на нее я оставлю ниже).



Ресурсы и ссылки

Если вы хотите узнать больше о визуализации данных, прочтите эти замечательные бесплатные книги: Платформы, демонстрирующие красивые визуализации Рекомендации по созданию графиков доступны на этих ресурсах.

Ссылки на эту статью Спасибо за прочтение!

6 принципов эффективной визуализации данных

Другие профессии и курсы ПРОФЕССИИ


КУРСЫ Теги: #Лайфхаки для гиков #данные #Большие данные #Визуализация данных #SkillFactory #Открытые данные #Инфографика #визуализация
Вместе с данным постом часто просматривают:

Автор Статьи


Зарегистрирован: 2019-12-10 15:07:06
Баллов опыта: 0
Всего постов на сайте: 0
Всего комментарий на сайте: 0
Dima Manisha

Dima Manisha

Эксперт Wmlog. Профессиональный веб-мастер, SEO-специалист, дизайнер, маркетолог и интернет-предприниматель.