Самая важная формула успеха – умение обращаться с людьми.
Теодор Рузвельт В последняя статья Я попытался рассказать об основах ценовой аналитики.
Теперь поговорим о более интересных вещах.
Вы когда-нибудь задумывались о том, почему вы покупаете в магазинах те или иные товары, как выбираете среди множества аналогов? На все возможные походы в магазин дать внятный ответ, скорее всего, не получится; многие из них спонтанны.
Но общая идея очевидна – когда вы идете в магазин, вы пытаетесь удовлетворить существующую потребность (в еде, гаджетах, развлечениях, блэкджеке).
В этой статье на примере продуктовых ритейлеров я расскажу о существующем опыте, как с помощью некоторых основных логических предположений и анализа сообществ в графиках можно точно определить, как покупатели выбирают товар.
Введение
Классические истории о ритейле сразу напоминают истории о рекомендательных системах, которые уже давно используют анализ данных о чеках клиентов.Например, известные рассказы о Цель и о пиво с подгузниками .
В основе этих случаев лежит известный в узких кругах подход, который называется Анализ рыночной корзины (MBA) или анализ ассоциативных правил.
Основная идея подхода — построить набор правил вида «когда покупают X, обычно покупают Y» и использовать их в дальнейших процессах (персональные рекомендации, показ и т. д.).
Правила позволяют определять продукты дополняет , которые дополняют друг друга.
Этот подход довольно популярен благодаря простоте реализации и хорошей интерпретируемости результатов.
Основные проблемы заключаются в том, что не всегда понятно, как применять полученные правила и как помимо дополняющих товаров идентифицировать товары-заменители.
Попробуем немного усовершенствовать этот подход: сгруппировать товары в зависимости от потребностей покупателей и понять, как покупатель принимает решение о покупке.
Усложняем MBA и ищем продукты-заменители
Немного усложним подход MBA и рассмотрим дополнительную информацию по картам лояльности, которые есть у многих российских ритейлеров (для онлайн можно использовать идентификатор клиента).Мы будем проводить MBA не на уровне проверочных данных, а на уровне карточек.
(т.е.
вместо идентификатора чека мы будем использовать идентификатор карты/идентификатор клиента).
В результате мы получим пары товаров, которые связаны друг с другом на уровне покупателя, т.е.
если покупатель купил товар X, то он покупает и товар Y и ключевое здесь то, что товар Y можно приобрести во время очередной поездки в магазин.
Давайте подумаем, как мы можем определить продукты-заменители.
Сделаем логичное предположение, что человек не часто покупает товар-заменитель в одном чеке (редко вы покупаете 3 и 5 кг стирального порошка одновременно).
Это самое важное допущение во всем анализе, оно хорошо работает для розничной торговли бакалейными товарами и товарами для дома и с небольшими поправками для других типов розничных торговцев.
Из этого предположения можно сделать вывод, что если пара товаров часто приобретается покупателями, но редко встречается в одном и том же чеке, то можно с большой уверенностью говорить, что это товары-заменители.
Утверждение достаточно сильное и требует предварительного качественного анализа связей — необходимо удалить статистически незначимые связи, убрать « бананы » и т. д. Для остальных подключений можно ввести метрику Вт , который отражает, насколько чаще товары приобретаются по одной карте лояльности, чем по одному чеку.
В результате у нас образовались пары товаров вида «продукты X и Y редко принимаются в одном чеке, но часто принимаются одними и теми же людьми» с некоторой долей связи.
Вт .
Чем больше эта мера связи, тем больше товаров можно считать заменителями.
Был MBA, стал SNA
Следующий логичный шаг — смотреть не на отдельные пары товаров, а на все доступные пары в совокупности.Те.
каждую пару товаров можно представить в виде ребра графа с весом W. Если графически представить полученные связи, то получится примерно следующее:
На графике четко видны «сообщества» товаров, тесно связанных друг с другом.
Применим алгоритмы поиска сообществ в графах ( анализ социальных сетей, СНС ) и посмотрите на результат. Например, используется алгоритм Лувейна .
В результате должны появиться группы товаров-заменителей.
Давайте посмотрим на пример результата:
- DANONE ACTIVIA вишня 2,9% 150г
- DANONE ACTIVIA клубника 2,4% 150г
- DANONE ACTIVIA черника 2,9% 150г
- Мюсли DANONE ACTIVIA 2,4% 150г
- DANONE ACTIVIA отруби и крупы 2,9% 150г
Есть, конечно, менее очевидные примеры, которые ритейлер классифицирует по разным группам, в частности из-за бренда, но с точки зрения покупателя они все же удовлетворяют одну потребность:
- Роскошный крем для лица для сухой кожи.
- Янтарный крем для лица для сухой и нормальной кожи.
- Морковный крем для лица Neva Cosmetics для сухой и чувствительной кожи.
- Крем для лица с огурцом Neva Cosmetics для жирной и комбинированной кожи.
- Крем для лица «Нева косметика оливковый» для сухой и нормальной кожи.
- Невская косметика Крем для лица Женьшень вокруг глаз
А теперь иерархия
Алгоритм Лувена позволяет строить иерархии сообществ.
В упрощенном виде - построим сообщества разного размера, разложим их в дерево( Дерево решений клиента ) и посмотрите пример результата:
Ура! Полученное дерево прекрасно интерпретируется с точки зрения бизнес-логики и интуиции — человек решил, что хочет сгущенку, затем выбрал между банкой и упаковкой, затем выбрал цену, по которой он готов купить продукт. Теперь мы понимаем, по каким характеристикам человек удовлетворяет потребность в сгущенке – типу упаковки и ценовому сегменту.
В данном конкретном примере нет привязанности к бренду и прочим вещам, которые люди часто любят приписывать продукту.
Дерево красивое, но что дальше?
Полученное дерево позволяет определить потребности покупателей (нижние уровни дерева) и характеристики товаров, влияющие на выбор (согласно иерархии дерева).Результат может быть применен в различных сферах розничной торговли:
- В идеале необходимо, чтобы каждая потребность покрывалась хотя бы одним продуктом.
Те.
В каждом магазине сети должна быть продукция, отвечающая потребностям покупателей.
Те.
Вместо 20 железных банок из-под сгущенки лучше иметь 10 железных банок и 10 пакетов.
- в рамках одной и той же потребности товары наиболее сильно каннибализируют друг друга.
Те.
Теперь мы ограничены набором продуктов, в рамках которых можно рассчитать перекрестные эффекты для прогнозирования цен и спроса.
- это дерево помогает при раскладке товара на полке (или заказе товара на сайте)
- в личных рекомендациях дополняет классический MBA для создания кросс-продажных предложений
Проблема интересная; вам нужно мыслить логически, анализировать данные и кластеризовать графики.
Надеюсь, было интересно! Оптимизируйте процессы, кластеризируйте графы, оптимизируйте хранение данных (ведь Garbage In – Garbage Out) и получайте отличные результаты.
Теги: #Машинное обучение #Социальные сети и сообщества #ритейл #Интеллектуальный анализ данных #анализ поведения #дерево решений клиентов
-
Дино Эспозито Выступит На .Next В Москве
19 Oct, 24 -
Мысли О Социализации Юридических Программ
19 Oct, 24