В четверг, 4 октября, я присутствовал на конференции DataVizDay в Минске в качестве спикера.
Поделюсь самыми интересными идеями и впечатлениями от Мишнки.
Ключевые идеи:
- 80% ваших усилий придется на BI и визуализацию, потому что данные либо плохие, либо очень плохие и вы в основном потратите время на подготовку и сбор данных.
2. Однако визуализация повышает ценность даты вашего продукта.
Без визуализации это просто набор цифр.
- К сожалению, очень часто визуализация плохая, используются неверные подходы, виды графиков и гистограмм, презентации перегружены деталями.
В результате мы часто видим Kill от Powerpoint, а обилие данных не добавляет прозрачности аналитике.
- Xcel продолжает играть важную роль в процессах.
И зачастую компании не готовы переходить на что-то передовое.
Но даже в Excel можно построить много интересного, ведь хорошая аналитика начинается с чистоты и подготовки данных, а не с красивых дашбордов.
- Из бизнес-кейсов — использование данных социальных сетей для построения карты «мыслей» о частях города.
Например, в Москве все твиты о центре, но о жизни вокруг центра никто не пишет. Его как будто нет в социальном пространстве, хотя там проживает большая часть москвичей.
- Более традиционные случаи включают сквозную аналитику от контакта до продажи.
Правда, пока никто не пришел к случаю не просто сквозной аналитики по контакту, а с учетом того, что у клиента может быть много контактов и последний контакт, приведший к покупке, не самый надежный указатель канала сбора данных.
Поэтому пока вся наша сквозная аналитика несколько перекошена в сторону чрезмерной важности каналов и недооценки того факта, что у людей может быть много контактов с брендом.
- Было много дискуссий о плохих визуализациях и о том, как их исправить.
Я узнал, что люди злоупотребляют круговой диаграммой, и преодолению этой проблемы был посвящен целый блок одной из презентаций.
Круговые диаграммы предлагается заменить гистограммами, диаграммами санкей или вообще заменить линии.
- Борются две парадигмы — аналитик данных должен только тыкать в кнопки, а аналитик данных должен уметь писать код (R/python, SQL) для своих конвейеров визуализации и обработки данных.
Лично я сторонник второго подхода, что-то вроде парадигмы DevOps, только в аналитике, когда технический вопрос не должен быть препятствием для доставки аналитических продуктов.
- Многие люди, с которыми я общался, часто жалуются, что у них никогда не было удобного хранилища данных и им приходится многое доделывать в Excel. Это при том, что у них полно бородатых итшников, которые пилят это хранилище годами.
- Еще одной проблемой является сильный разрыв между ИТ и не ИТ.
Люди не умеют говорить на одном языке и не решают проблему, а решают только проблемы в «своей зоне ответственности».
Именно поэтому появляются ненужные хранилища, а рядом с ними люди режут свои конвейеры в Excel.
- Мы поговорили с коллегой еще об одной актуальной проблеме — как повысить Data Literacy в компании.
Какими бы ни были данные и их хранение, их неправильное извлечение, интерпретация и обработка означает фальшивую аналитику.
И поскольку данные становятся все более демократизированными, каждый пользователь должен каким-то образом пройти минимальное обучение, чтобы использовать эти данные.
Но зачастую компании не очень хорошо справляются с подготовкой, обучением и документацией по использованию хранилища.
Если кто-то смог организовать хороший тренинг по Data Literacy, то можно говорить — это горячая тема и я буду сидеть в первом ряду.
- Некоторые темы касались работы с картами.
К сожалению, я пропустил эти выступления.
Могу только сказать, что работа с картами и их визуализация – это действительно интересный и важный инструмент управления компанией.
Табло и Power BI позволяют рисовать на картах различные карты, точки, полигоны и линии, имеется множество источников геоданных, которые вы можете объединить с данными вашей компании и получить интересную информацию: новые точки для бизнеса, концентрацию конкурентов, информацию о расстоянии.
вашим клиентам, взаимосвязь между уровнем жилья и уровнем потребления и многое другое.
Скоро напишу о своем опыте работы с картами и о том, какие инструменты мы пробовали.
- Моя тема доклада была посвящена опыту организации работы отдела аналитики с использованием Scrum. Об этом я сделаю отдельный пост.
Не глупите во время кофе-брейков, а общайтесь с как можно большим количеством людей! Минск сам по себе замечательный город. Я почему-то ждал «замороженного совка».
Во всяком случае, именно такое впечатление остается от международной части минского аэропорта.
Но сам город выглядит как смесь Петербурга, сталинской Москвы и совсем не Совка.
При этом все аккуратно, не перегружено компактными постройками, места много и даже «советские» дома выглядят прилично.
Организаторы пообещали провести конференцию в следующем году на двух площадках в Москве и Минске, так что если не можете приехать в Минск, то попробуйте приехать в Москву.
Еще у меня был отчет и совсем не о визуализации, а о том, как мы делали Scrum в аналитической команде.
Отчетами поделюсь в следующей статье.
Теги: #анализ данных #конференция #Минск #dwh #Data Mining #Визуализация данных #Конференции
-
Как Поднять Российскую «Науку»
19 Oct, 24 -
Владельцы Яндекса Купили Icontext
19 Oct, 24