Каршеринг, несмотря на свою молодость, является одним из наиболее активно развивающихся направлений российского автобизнеса.
Прошло 5 лет с момента запуска первой компании, и сегодня на рынке работает более 25 операторов, специализирующихся на краткосрочной аренде.
С развитием каршеринга данные о пользователях накапливаются, и теперь у каршеринга, как и у банков, есть некая система скоринга клиентов.
Он также зависит от возраста, пола, стажа вождения, но учитывает не вашу кредитную историю, а историю путешествий.
Одной из целей такого скоринга, помимо оценки платежеспособности, проверки водительских прав и штрафов, является прогнозирование вероятности ДТП для конкретного водителя.
В этой статье мы разберем логику алгоритмов начисления баллов пользователям каршеринга, которые будут основываться только на возрасте и стиле вождения.
Помимо этих параметров, для получения более точных результатов можно использовать социальный статус, поездки с детьми, активность в социальных сетях и информацию с камеры в автомобиле.
Однако сегодня мы остановимся на двух основных – возрасте и стиле вождения.
Отметим, что в статье мы продемонстрируем логику скоринга на примере водительской активности 50 000 пользователей и 260 000 поездок.
Все данные были анонимизированы.
Кроме того, мы использовали данные о 220 дорожно-транспортных происшествиях, совершенных в Москве и Московской области.
В каршеринге автомобиль – это средство получения прибыли, приобретенное на кредитные деньги.
При таком подходе важно использовать его максимально эффективно, не допуская простоев.
А если автомобиль попал в аварию, то оформление документов со страховщиком, согласование, заказ запчастей и сам ремонт могут занять значительное время, от нескольких дней до месяцев.
С помощью системы баллов можно прогнозировать потенциальные аварии и использовать их для предоставления клиентам обратной связи о рисках небезопасного вождения.
Для операторов каршеринга важно сохранить свое имущество и заработать на нем.
Таким образом, платформа каршеринга просто обязана собирать всю возможную информацию об автомобиле и о том, что с ним происходит. Для каждой поездки автомобиль каршеринга собирает телематические данные — точки поездки с интервалом не более 1 секунды и характеристики автомобиля в этих точках (скорость, обороты, ускорение, состояние дверей и окон и т. д.).
Возраст
При заключении договора с оператором каршеринга водитель должен указать свой возраст и стаж вождения.На основе этих данных мы можем построить следующую гистограмму.
Рисунок 1. Возраст пользователей
На рисунке 1 представлена гистограмма возраста пользователей каршеринга.
По горизонтальной оси — возраст пользователей, по вертикальной — их количество, пунктиром отмечена медиана — 30 лет. Судя по всему, наблюдается нормальное распределение и выраженные всплески числа пользователей в возрасте 25, 30 и 35 лет. Далее рассмотрим распределение пользователей по возрастам, выявленных виновниками аварии.
Рисунок 2. Возраст пользователей, попавших в дорожно-транспортные происшествия
На рисунке 2 представлена гистограмма распределения возрастов участников дорожно-транспортных происшествий, по горизонтали - возраст пользователей, по вертикали - количество пользователей.
Опять же пунктиром отмечена медиана — 26 лет. Таким образом, видно, что пользователи младше 26 лет чаще других становятся причиной несчастных случаев.
Из гистограммы видно, что половина происшествий произошла по вине группы, составлявшей четверть пользователей (пользователи до 26 лет).
Аналогично, группа пользователей старше 30 лет, составляющая половину от общего числа, стала причиной только четверти несчастных случаев.
Таким образом, мы получаем, что вероятность ДТП для пользователей до 26 лет в четыре раза выше, чем для пользователей старше 30. Это привлекает дополнительное внимание к более молодой группе пользователей со стороны операторов каршеринга.
Не случайно для многих операторов возрастные требования начинаются не с 18, а с 21 года.
Каршеринговые компании также хотят видеть среди своих пользователей опытных водителей и указывать стаж не менее 2 лет, тем самым исключая неопытных молодых водителей.
Стиль вождения
Со стилем вождения дела обстоят сложнее.На данный момент в отрасли существует устоявшаяся модель определения стиля вождения – модель расчета резкого ускорения и торможения.
Давайте посмотрим на это поближе.
Рисунок 3. График изменения скорости автомобиля.
Если скорость автомобиля за промежуток времени ∆t≤3сек.
увеличивается на ∆s≥15 км/ч, то за этот промежуток времени автомобиль резко ускоряется.
Аналогично, если в течение интервала времени ∆t≤3 сек.
Скорость автомобиля снижается на ∆s≥15 км/ч, затем в этот промежуток времени автомобиль резко тормозит. ∆t и ∆s являются параметрами модели и могут быть изменены как в большую, так и в меньшую сторону.
Например, на графике 3 представлена зависимость скорости автомобиля от времени, причем в интервале с 8-й по 11-ю секунду скорость автомобиля резко возросла с 20 км/ч до 40 км/ч, а в интервале с 15-й по на 18-й секунде скорость резко упала с 60 км/ч до 30 км/ч.
А – количество резких ускорений на маршруте, Б – количество резких торможений.
На рис.
4 показано распределение суммы A+B на выборке используемых маршрутов.
Рисунок 4. Распределение резких ускорений и торможений
Обратите внимание, что поездка может длиться 15 минут, а может и 5 часов, поэтому при выборе параметров скоринга необходимо учитывать время или расстояние поездки.
D – длина маршрута в километрах.
Посчитаем количество резких ускорений и торможений на 1 км маршрута, т.е.
((A+B))/D. Мы получаем асимметричное распределение, показанное на гистограмме рисунка 5, где значения слева затухают гораздо быстрее, чем справа.
К сожалению, большинство статистических методов не работают для сильно асимметричных распределений.
В таких случаях обычно помогает логарифмическое преобразование, которое часто превращает асимметрию в симметрию, поскольку позволяет растянуть шкалу вокруг нуля.
Рисунок 5. Распределение ускорений и замедлений на 1 км маршрута
Логарифмируя эту функцию, получаем Log(((A+B))/D).
В результате распределение очень похоже на нормальное – рисунок 6.
Рисунок 6. Логарифм количества ускорений и замедлений на 1 км поездки
Именно на основе этой функции обычно строится модель оценки стиля вождения.
Попробуем пропустить все маршруты каждого пользователя через подобную функцию.
Гистограмма представлена на рисунке 7.
Рисунок 7. Сравнение пользователей с авариями и без аварий
Он показывает результаты всех пользователей синим цветом: синяя пунктирная линия — их медиана, красная — результаты пользователей, попавших в аварию, а красная пунктирная линия — их медиана.
Видно, что результаты пользователей, попавших в ДТП, смещены вправо, т.е.
пользователи, попавшие в ДТП, чаще резко тормозят и ускоряются во время движения.
Однако сдвиг крайне мал и фактически никакой корреляции между значением этой функции и фактом попадания в аварию нет. Учитывается средняя производительность пользователей, однако возможно, что пользователи в среднем ездят безопасно, но иногда ездят неосторожно.
Рассмотрим безаварийные поездки с максимальным значением функции Log(((A+B))/D) для каждого пользователя.
Результирующая гистограмма представлена на рисунке 8, где пунктирная линия обозначает медиану.
Рисунок 8. Худшие поездки пользователей
Добавим гистограмму поездок пользователей с ДТП, а также не будем учитывать их поездки, в которых произошли ДТП.
Полученные гистограммы представлены на рисунке 9, где синяя пунктирная линия — это медиана поездок пользователя без происшествий, оранжевая пунктирная линия — медиана поездок пользователя с авариями.
Здесь наблюдается больший сдвиг вправо.
Те.
С учетом этого из общей группы выделяются пользователи, попавшие в дорожно-транспортные происшествия.
Рисунок 9. Сравнение худших поездок пользователей
На основе этого метода мы строим скоринговую модель.
Результаты работы модели отображены на рисунке 10. Результаты всех пользователей выделены синим цветом, результаты пользователей, попавших в аварию, — оранжевым.
Оценка от 0 до 10, где 0 — худший результат, 10 — лучший.
Пунктирные линии обозначают средние скорости двух групп пользователей.
При этом средняя скорость пользователей, попавших в аварию, составляет около 4, а всех пользователей — 5. 80% пользователей, попавших в аварию, имеют скорость ниже средней, иными словами, 80% пользователей, попавших в аварию, ездят хуже, чем средний.
Рисунок 10. Результаты подсчета баллов
Подобная модель обычно используется при подсчете баллов за вождение с использованием телематических данных.
По его результатам доступ к автомобилям премиум-класса или даже к сервису может быть ограничен.
Однако он не единственный и не самый оптимальный для всех случаев.
Описанная в статье модель не идеальна для прогнозирования дорожно-транспортных происшествий.
В этой статье мы рассмотрели только актуальные модели в каршеринге.
В следующей части мы поговорим о модели энергии движения, которая основана именно на стиле вождения (стиль изменения скорости, маневрирования и т. д.).
Автор: Кирилл Кульченков, Кульченков32 , бизнес-консультант Bright Box. Теги: #Разработка для Интернета вещей #Алгоритмы #программирование #Интернет вещей #статистика #каршеринг #скоринг #подключенный автомобиль #безопасность вождения
-
Jelly Bean Портирован На Armv6
19 Oct, 24 -
Социальный Ингибитор
19 Oct, 24 -
Подкаст «Я Сказал На Каннада» (№ 21)
19 Oct, 24 -
Qip Infium: Первая Информация И Скриншоты
19 Oct, 24