Возможность Отображения Ценовой Аналитики

Многие ресурсы по продаже чего-либо предоставляют пользователям дополнительную информацию и возможности сравнения аналогичных товаров.

Это может быть сравнение характеристик мониторов в интернет-магазине или показ аналогичной недвижимости в данном городе и регионе.

В любом случае, когда кто-то решает что-то продать/купить, перед ним всегда встает вопрос – и по какой цене? Существует предположение, что ресурсы, способные грамотно предлагать цены на товары продавцам/покупателям , может получить дополнительный интерес от пользователей.

На этот вопрос можно ответить более или менее определенно.

(какая цена товара?) - если выставленный на продажу товар новый, в этом случае можно проанализировать цены на этот же товар в магазинах, автосалонах, интернет-площадках.

С ценами на бывшие в употреблении товары несколько сложнее.

Сложность заключается в том, что в процессе использования продукт приобретает уникальные характеристики.

Один ездит на машине каждый день на протяжении многих лет – но осторожно, другой вкладывает деньги в тюнинг, третий занимается художественной лепкой на потолке своей квартиры, четвертый любит иногда ронять монитор на пол… И все они в какой-то момент захотят продать свою машину, квартиру, монитор и т. д. Второй такой машины в мире может и не быть.

Было много одинаковых машин - когда они сходили с конвейера - но после того, как ими управляли разные люди в разных условиях - машины становились разными.

В той или иной степени это касается не только автомобилей, но и любого другого товара.

Вот почему Средняя стоимость является своего рода ориентиром, от которого могут отталкиваться продавец и покупатель.

Ниже я приведу пример, как выполнить эту задачу — определение примерной стоимости товара — пытаемся решить на сайте продажи автомобилей am.ua .

Изначально мы ограничили количество параметров, используемых для анализа средних цен.

На основе: марка, модель, тип коробки передач и год выпуска автомобиля .

Ограничение параметров для анализа вызвано ограниченным набором входных данных – на сайте всего около 50 000 актуальных объявлений.

Средние цены рассчитывается не для всех объявлений (по некоторым маркам и моделям недостаточно данных для статистического анализа).

Саму диаграмму мы обеспечили некоторой степенью интерактивности — точки на диаграмме являются ссылками на рекламу, либо на страницы с рекламой конкретного года выпуска.

Для изучения реакции пользователей мы добавили кнопку «оставить желание».

В целом отзывы были положительными.

Однако иногда я встречал комментарии типа: средняя цена похожа на среднюю температуру в больнице .

Данное замечание не лишено здравого смысла, как и требование учитывать при анализе конкретную комплектацию/модификацию, объём двигателя и другие параметры.

С другой стороны, если увеличить количество параметров, учитываемых при анализе, количество графиков для рекламы резко уменьшится – все это вызвано тем же ограниченным набором данных.

Здесь приходится балансировать между желанием пользователей видеть более точную цифру средней стоимости — и желанием пользователей видеть эту цифру рядом с каждым автомобилем.

Мы остановились на варианте отображения достаточно приблизительной средней цены, которая служит отправной точкой при торгах между покупателем и продавцом ( моя машина стоит дороже, потому что в ней есть то и это ) Для полноты опишу кратко алгоритм расчета средних цен:

  • производится подборка актуальных объявлений по конкретной марке/модели/коробке передач - данные сортируются по годам (не растаможенные и после ДТП отбрасываются)
  • возьмем минимальный и максимальный год, в котором имеется хотя бы 10 реклама
  • за каждый год из полученного диапазона рассчитывается средняя арифметическая цена (максимальное и минимальное значения отбрасываются)
  • средняя цена за конкретный год рассчитывается по формуле middlePrice=(y0*((k-x)/k)*$zexp(b*x))+(yn*(x/k)*$zexp(b*(k-x))) Где: $zexp - это е в степени й0 — среднее арифметическое цен в год начала диапазона ын — среднее арифметическое цен в году окончания диапазона к — диапазон лет Икс — разница между конкретным годом и годом начала диапазона б — выбираемый коэффициент внутри [-0.1:0]
  • происходит отбор б при котором среднее процентное отклонение цен, полученных от среднеарифметических цен, минимально
  • если минимальное среднее отклонение не превышает 10% — записываются данные для графика
Ээкспоненциальная функция была специально зафиксирована на краях диапазона [y0:yn] - поскольку он имеет тенденцию быстро увеличиваться даже при небольших б .

Описанная реализация отображения ценовой аналитики является первой пробной версией, которая не претендует на совершенство и полноту.

Если кто-то сталкивался с подобными проблемами и может поделиться опытом, буду очень признателен.

Советы по улучшению математики также будут полезны.

Особенно интересно, как вы решаете проблему баланса между качеством и количеством предоставляемой аналитической информации - в системах, где точность не критична( Абсолютно точной средней цены на товар не существует. ).

Теги: #анализ цен #авто #автомобили #Я пиарюсь

Вместе с данным постом часто просматривают: