Еще 12 Кейсов С Большими Данными

Хабр, здравствуйте.

Сегодня мы подготовили еще 12 примеров того, как технологии больших данных приносят деньги компаниям.



Ориентация на клиента



1. Компания: Билайн.

Промышленность: телекоммуникации «Билайн» располагает огромным набором данных о своих абонентах, которые компания планирует использовать не только для внутренней оптимизации и обслуживания клиентов (увеличение продаж, удержание клиентов, борьба с мошенничеством), но и для вывода на рынок новых аналитических продуктов (предоставление данных).

для кредитного скоринга, таргетинга цифровой рекламы, создания геоаналитических отчетов, аналитики IPTV, внешнего консалтинга).

Компания реализовала множество проектов по работе с большими данными.

Например, абонентская база была сегментирована на основе расширенного профиля клиента, включая прогнозирование половой и возрастной категории, построение социальных графов; реализован проект по распознаванию и защите абонентов от финансового мошенничества и вирусной активности; были определены абоненты, пользующиеся услугами связи на нескольких типах устройств, а также абоненты в аэропорту и вылетающие за границу с целью предложить им подходящие услуги и тарифные планы.

И это не полный список.

Компания использует HDFS и Apache Spark для хранения и обработки данных, а также Rapidminer и Python, включая библиотеку scikit-learn, для анализа данных.

Результат: К 2018 году прогнозируемые доходы от больших данных составят более 20% выручки компании.



2. Компания: Caesars Entertainment.

Промышленность: развлечения, игорный бизнес.

Caesars Entertainment – один из лидеров игорного бизнеса США, управляющий знаменитым казино Caesar's Palace в Лас-Вегасе и более 50 игорными заведениями по всему миру.

Сама компания недавно была оштрафована на сумму более 20 миллионов долларов за отмывание денег, а ее подразделение казино было объявлено о банкротстве.

Однако за 17 лет компания накопила впечатляющий объем данных и аналитики по своей программе лояльности Total Rewards, которая сейчас является одним из ее самых ценных активов и оценивается в 1 миллиард долларов.

В игровой индустрии важны данные о каждом клиенте: некоторые игроки высшей, седьмой категории по классификации компании, ежегодно тратили в казино около $500 тысяч, а один бизнесмен в базе даже оставил за год в Лас-Вегасе $200 миллионов.

.

Очень важно иметь возможность встретить такого клиента по имени, отвести его в любимую игру и предложить бесплатно дополнительные опции по его вкусу: развлечения, авиабилеты, поездки на лимузине, размещение в гостинице и т.д. Используя накопленные данные о вкусах клиентов и поведения и передовых методов анализа данных, компания смогла найти подход к клиентам так, чтобы они оставляли как можно больше денег и обязательно возвращались снова.

Компания использует Hadoop и облачные решения, обрабатывая более 3 миллионов записей в час.

Аналитика данных также используется для сегментации клиентов и улучшения стандартов безопасности.

Результат: Создан самый ценный индивидуальный актив компании стоимостью более 1 миллиарда долларов, достигнуто повышение стандартов рентабельности и безопасности.



3.Компания: eHarmony.

Промышленность: сайты знакомств.

eHarmony — это сайт знакомств, ориентированный на построение долгосрочных отношений.

В анкете на сайте пользователь может оставить о себе очень подробную информацию и указать более 1000 параметров.

Далее, используя эти данные, а также историю лайков и развития отношений пользователей сайта, система рекомендует наиболее подходящие варианты знакомств, причем не только на основе схожих интересов и убеждений.

Анализируются фотографии пользователей, которые дополняют друг друга и сочетаются, но в то же время вызывают особое притяжение между людьми.

Например, выяснилось, что вегетарианцы с большей вероятностью образуют стабильную пару, чем любители гамбургеров, а область лица на фотографии оказывает определенное влияние на взаимную привлекательность.

Компания также анализирует эффективность маркетинговых каналов компании, использует персонализированную рекламу, управляет лояльностью пользователей и противодействует оттоку клиентов.

При анализе данных компания использует решения SPSS, рекомендательные системы, Hadoop, Hive и облачные технологии.

Результат: Каждый день система делает около 100 миллионов предположений о том, какие два человека могут подойти друг другу, и ежегодно экономит 10 миллионов долларов за счет сокращения оттока клиентов и сокращения неэффективных маркетинговых затрат.

4. Компания: Nippon Paint.

Промышленность: химическая промышленность, производство красок и лаков.

Nippon Paint — японская компания, занимающая 7-е место по обороту в мире среди компаний-производителей красок и ведущая компания отрасли на китайском рынке.

Использование веб-сайта, запущенного компанией iColor , позволяющая опробовать разные цвета краски в реальных интерьерах, завоевала широкую популярность как среди частных клиентов, так и среди дизайнеров и дизайнерских компаний.

Анализ данных, полученных через этот сайт, позволяет компании отслеживать новые тенденции в цветах и дизайнах, чтобы разрабатывать новые продукты и планировать производство.

Также с помощью этой платформы компания взаимодействует с дизайнерами и дизайнерскими компаниями для продвижения через них продукции компании, сегментирует потребителей и создает для них персонализированные предложения.

Для обработки и анализа данных компания использует решения на базе SAP HANA и Hadoop.

Еще 12 кейсов с большими данными

Результат: компания получила мощный инструмент выявления и отслеживания тенденций рынка, позволяющий планировать спрос и разрабатывать новые продукты, а также платформу для решения ряда других задач целевого взаимодействия с клиентами.



5. Компания: Hitachi Consulting, Vital Connect, ClearStory Data.

Промышленность: здравоохранение.

В США сепсис занимает 10-е место в рейтинге причин смертности среди болезней.

Ежегодно от сепсиса страдает около 1 миллиона американцев, и от 28% до 50% из них умирают. На лечение сепсиса ежегодно тратится около 20 миллиардов долларов.

Основная причина смертности – недостаточное медицинское наблюдение.

Пациенты выписываются из больницы или получают первую помощь и в дальнейшем не находятся под наблюдением.

Однако после этого высок риск развития сепсиса, симптомы которого — лихорадка, озноб, учащенное дыхание и пульс, сыпь, спутанность сознания и дезориентация — аналогичны симптомам других распространенных заболеваний.

Зачастую пациенты обращаются к врачу слишком поздно или заболевание не удается правильно диагностировать на ранних стадиях.

В результате быстро развивается септический шок и нередко происходит необратимое поражение сразу нескольких органов.

Для мониторинга состояния пациентов предлагается использовать сертифицированное устройство HealthPatch от компании Vital Connect, которое будет собирать основные показатели состояния пациента, включая даже позы и движения (при сепсисе они изменяются).

Далее информация поступает на серверы ClearStory Data, где объединяется с другими медицинскими данными о пациентах и анализируется в режиме реального времени с помощью решения на базе Apache Spark. В будущем такие устройства будут получать все пациенты, выходящие из больниц и получающие первую помощь при состояниях, которые могут повлечь за собой сепсис.

Похожая система, но с более низким уровнем анализа данных, уже успешно внедрена в Сингапуре.

Результат: создано решение, которое позволит системе здравоохранения США существенно снизить смертность от сепсиса (общего заражения крови).



6. Компания: JJ Food Service.

Промышленность: b2b доставка еды.

JJ Food Service — одна из крупнейших британских b2b-компаний по доставке еды, имеющая более 60 тысяч клиентов в виде кафе, ресторанов, школьных и офисных столовых и т. д. В 2010 году компания принимала практически все заказы через колл-центры; сегодня 60% заказов принимается через интернет-портал.

Это повысило эффективность, но привело к потере личного контакта с клиентом.

По телефону клиенту предлагали приобрести более дорогие или сопутствующие товары и услуги, а также информировали о тенденциях в его сегменте рынка.

Эти возможности пришлось реализовать на новом уровне с использованием технологий больших данных.

Для решения этих проблем компания обратилась к специалистам Microsoft для создания решения на базе облачных сервисов Azure Machine Learning. Рекомендации, сформированные с помощью прогнозных моделей, построенных на этой платформе, теперь используются не только на интернет-портале, но и сотрудниками колл-центра.

Когда клиент звонит в колл-центр или заходит на сайт, его корзина уже заполняется на основе истории покупок и рекомендаций (учитываются рецепты, аналогичные заказы других пользователей, добавляются новинки, о которых клиенты еще не знают).

Около 80% этих товаров фактически остаются в корзине и покупаются.

Такое решение возможно в b2b-индустрии, потому что.

Зачастую необходимы достаточно регулярные поставки определенного набора товаров.

Непосредственно перед оформлением заказа учитывается тип заведения и рецепты, которые оно использует, чтобы определить, не забыл ли клиент купить что-то необходимое.

Внедрение системы заняло 3 месяца.



Еще 12 кейсов с большими данными

Результат: 80% товаров в предварительно заполненных корзинах покупок покупаются покупателями, что увеличивает продажи, скорость обслуживания и удовлетворенность клиентов.



Внутренняя оптимизация



1. Компания: Сбербанк.

Промышленность: банковское дело В предыдущем посте мы уже описывали некоторые кейсы использования больших данных в Сбербанке, в этом поговорим о другом кейсе — AS SAFI. Данная система анализа фотографий для идентификации клиентов и предотвращения мошенничества с документами была разработана и внедрена в Сбербанке к началу 2014 года.

Работа системы основана на сравнении фотографий из базы данных с изображениями, полученными веб-камерами на прилавках с использованием технологий компьютерного зрения.

В результате убытки от этого вида мошенничества сократились в 10 раз.

Основой АС стала биометрическая платформа «Каскад-Поиск» от компании «Техносерв».

Изначально данная система разрабатывалась для использования в оперативной, справочной и экспертной работе, но была адаптирована для нужд Сбербанка и интегрирована с автоматизированной системой рассмотрения кредитных заявок.

Система работает очень быстро: благодаря ряду инновационных решений, таких как In-Memory Processing, сопоставление изображений с камеры и изображений в базе данных занимает всего несколько секунд. Результат: потери от мошенничества с документами физических лиц сократились в 10 раз.



2. Компания: FarmLogs.

Промышленность: Сельское хозяйство.

FarmLogs — компания, которая предоставляет фермерам аналитику больших данных и удобные сервисы для планирования и оптимизации их работы.

Мобильные и веб-приложения компании уже используют более трети фермеров США.

Сервисы FarmLogs используют открытые геоданные о типе почвы, подробные данные о погодных условиях, осадках и солнечной активности.

Анализ спутниковых снимков также широко используется для автоматического определения посевов различных культур, наблюдения за их состоянием и учета исторических данных для прогнозирования и выдачи рекомендаций.

Компания предоставляет фермерам в аренду устройства, которые устанавливаются на сельскохозяйственные комбайны и автоматически записывают в систему данные обо всех выполняемых операциях, маршрутах и расходе топлива.

В результате формируются подробные рекомендации по ведению хозяйства и автоматически проводятся все необходимые расчеты, в том числе финансовые.

Результат: Сравнительно далекий от высоких технологий сельскохозяйственный сектор экономики США охвачен оптимизацией больших данных более чем на треть.



3. Компания: Аэропорты Дубая.

Промышленность : транспорт - аэропорты.

Международный аэропорт Дубая – самый загруженный аэропорт мира по международному пассажиропотоку, один из крупнейших в мире.

Большие данные о работе аэропортов, рейсах и перемещениях пассажиров широко используются для оптимизации работы аэропортов и повышения удовлетворенности пассажиров.

В аэропорту используются сложные алгоритмы оптимизации для динамического назначения выходов на посадку и прибытие.

В частности, если на двух рейсах большое количество пассажиров пересаживается с одного рейса на другой, их выходы на посадку будут расположены рядом.

Многие пассажиры приезжают в Дубай за покупками, а в аэропорту есть множество магазинов беспошлинной торговли.

Однако страсть к шопингу приводит к тому, что пассажиры часто опаздывают на рейсы.

Многие из них не говорят ни на английском, ни на арабском языке — языках, на которых делаются объявления.

Благодаря внедрению новой программы оповещения посадочные талоны пассажиров сканируются в каждом магазине аэропорта, и они получают оповещения о том, к какому выходу на посадку им нужно пройти, по какому маршруту им нужно следовать и сколько времени это займет, на языке, на котором они говорят. Результат: Оптимизировано распределение выходов на посадку и прилет, а количество задержек рейсов значительно сокращено.



4. Компания: Macy's.

Промышленность: розничная торговля одеждой, обувью и аксессуарами.

Macy’s — крупная сеть универмагов, основанная в 1858 году и сегодня насчитывающая более 840 магазинов в 45 штатах США.

В течение года 70% американцев хотя бы раз посещают магазины сети.

Компания анализирует большие объемы данных о спросе, акциях и отсутствии товаров в конкретных магазинах, объединяет эти данные с предпочтениями покупателей, проживающих в заданном районе, и таким образом оптимизирует ассортимент всех категорий товаров в каждой торговой точке.

Используя технологии SAS Institute, ритейлер практически в реальном времени корректирует цены на 73 миллиона товаров, используя данные о спросе и имеющихся запасах.

Компания использует большие данные не только с точки зрения внутренней оптимизации, но и с точки зрения клиентоориентированности.

Например, интернет-магазин Macys.com, как и другие интернет-магазины, использует персонализацию, таргетированные рекламные баннеры и почтовые кампании, а также поисковую оптимизацию сайта, чтобы покупатель мог легко найти интересующий его товар.

Персонализация рекламных сообщений и предложений в компании очень много; количество уникальных вариаций одной рассылки может достигать 500 000. Результат: высокие темпы роста продаж (до 50% в год), не менее 10% из которых, по оценкам компании, — чистый эффект больших данных.



5. Компания: Родословная.

Промышленность: банк данных, справочная система.

Главный актив Ancestry — огромная база современных и исторических документов, позволяющая восстанавливать родственные связи между людьми и строить генеалогические древа.

Сегодня банк данных компании содержит более 5 миллиардов анкет людей, живших в разное время (начиная с 16 века) в большом количестве стран; построено более 45 миллионов генеалогических древ, определяющих родственные связи между ними.

Исторические данные обычно не представляются в машиночитаемом формате.

Это могут быть, например, рукописные записи в бухгалтерских книгах.

Кроме того, такие данные могут быть противоречивыми, неточными и неполными.

Алгоритмы интеллектуального анализа данных и машинного обучения, включая алгоритмы нечеткого сопоставления, помогают компании обрабатывать, дополнять и проверять данные.

Технологии больших данных используются для хранения и анализа данных.

Данные о предках обрабатываются на трех кластерах MapR (распределение на основе Hadoop).

Первый сравнивает результаты анализа ДНК с образцами в базе данных (их в базе уже более 120 тысяч образцов), которые пользователи могут получить всего за $99, сплюнув в пробирку и отправив в компанию образец слюны по почте.

Второй реализует алгоритмы машинного обучения, третий — интеллектуальный анализ данных.

Предварительный анализ базы данных позволяет упростить поиск родственников и сформировать предположения, облегчающие исследование семейного анамнеза.

Сегодня огромное количество открытий, сделанных пользователями, обеспечивается за счет предварительного подключения профилей и ранжирования результатов, осуществляемого системой на основе анализа данных профиля и предыдущей истории поиска в системе.

Всего несколько лет назад все подобные открытия были заслугой только пользователей системы.

Пользовательский опыт системы также постоянно анализируется для выявления областей, в которых у пользователей возникают трудности, чтобы в эти области можно было добавить дополнительный контент или ранжировать результаты поиска.



Еще 12 кейсов с большими данными

Результат: Была накоплена огромная историческая база данных с очищенными, подтвержденными и предварительно связанными записями, что обеспечивает простое и продуктивное использование системы.



6. Компания: Rolls-Royce Holdings.

Промышленность: машиностроение, производство двигателей.

Rolls-Royce Holdings — британская транснациональная компания, производящая двигатели и турбины для аэрокосмической, морской и энергетической промышленности.

Двигатели, которые они производят, очень большие и дорогие, а ошибки и ошибки при их производстве могут стоить миллионы и привести к человеческим жертвам.

Rolls-Royce использует технологии больших данных при разработке, производстве и послепродажной поддержке своих двигателей.

При разработке двигателей широко используется компьютерное моделирование, производящее терабайты данных.

Анализ и визуализация этих данных осуществляется на высокопроизводительных вычислительных кластерах.

Производственные системы компании общаются друг с другом через Интернет вещей.

Двигатели Rolls-Royce оснащены сотнями датчиков, фиксирующих мельчайшие детали их работы.

Эти данные быстро обрабатываются с помощью алгоритмов машинного обучения и в случае отклонений передаются инженерам.

Компания не дает точную оценку эффективности внедрения технологий больших данных, однако, по словам руководства компании, они привели к существенному сокращению затрат. Большие данные также изменили бизнес-модель компании: благодаря им компания смогла предложить клиентам новую модель корпуса «Total Care», при которой компании платят почасово за контроль за исправностью двигателей во время их работы.

Результат: значительное снижение затрат на разработку и производство, повышение надежности и внедрение новой бизнес-модели.

Мы приветствуем ваши комментарии.

И мы ждем вас по адресу программа «Специалист по большим данным» стартует 15 марта.

Теги: #Интеллектуальный анализ данных #Большие данные #решения для больших данных #Интеллектуальный анализ данных #Большие данные #Машинное обучение

Вместе с данным постом часто просматривают:

Автор Статьи


Зарегистрирован: 2019-12-10 15:07:06
Баллов опыта: 0
Всего постов на сайте: 0
Всего комментарий на сайте: 0
Dima Manisha

Dima Manisha

Эксперт Wmlog. Профессиональный веб-мастер, SEO-специалист, дизайнер, маркетолог и интернет-предприниматель.