Борьба С Накрутками В Рейтингах

На днях прочитал интересную статья о рейтингах.

Не рекомендую использовать ее в качестве практического руководства (почему смотрите в комментариях к ней), однако прочитать ее было интересно и натолкнуло на одну идею.

Допустим, у нас есть рейтинг от 1 до 5. Причем некоторые рейтинги завышены, некоторые пользователи выставляют их случайным образом.

Как отфильтровать зерна от плевел? Если построить диаграмму количества людей, поставивших определенный рейтинг, то можно примерно увидеть, на сколько голосов было увеличено.

Надо, конечно, сравнивать с другими диаграммами, но из этой картинки видно, что некоторые из «пятерок» напортачили:

Борьба с накрутками в рейтингах

В общем, человек может определить разметку по схеме, а значит, и машина тоже.

Распределение голосов можно описать функция бета-распределения .



Борьба с накрутками в рейтингах

Если в большинстве случаев голосование можно описать бета-функцией, а в некоторых случаях нет, то часть голосов можно удалить.



Борьба с накрутками в рейтингах

Таким образом мы исключим не все плохие голоса, мы исключим некоторые хорошие.

Для статей с небольшим количеством голосов такие манипуляции недопустимы.

Бета-распределение имеет два параметра: альфа и бета.

Еще у нас есть два параметра: средний балл (E) и дисперсия (D) — мера дисперсии.

Из Википедии это известно.



Борьба с накрутками в рейтингах



Борьба с накрутками в рейтингах

Теперь решим систему уравнений.

Это долго и утомительно.

Е=а/(а+b) d=ab/((a+b)^2 * (a+b+1)) замените a/(a+b) на E d=bE/((a+b) * (a+b+1)) замените 1/(a+b) на E/a d=b*E^2/(a * (a+b+1)) умножьте обе части на (a * (a+b+1)) d(а * (а+b+1))=b*E^2 раскрой скобки и поменяй местами b*E^2=да^2 + даб + да вычесть мазок с обеих сторон б*E^2-даб=да^2 + да б(Е^2-да)=да(а+1) б=да(а+1)/(Е^2-да) Вернемся к первому уравнению E=a/(a+b)=> (a+b)=a/E=> b=a/E -a давайте объединим оба уравнения б=а/Е -а=да(а+1)/(Е^2-да) а/Е -а=да(а+1)/(Е^2-да) разделить на 1/E -1=d(a+1)/(E^2-da) умножить на E(E^2-da) (1-E)(E^2-da)=Ed(a+1) Е^2-да -Е^3 + Эда=Еда + Эд Эда сжимается E^2-да -E^3 = Эд E^2 -E^3 -Ed =da а= (Е^2 -Е^3 -Ed)/d b=a/E -a=a(1/E-1)=a(1-E)/E=(E^2 -E^3 -Ed)(1-E)/Ed=(E -E^ 2 -d)(1-E)/d=(E -E^2 -d - E^2 + E^3 +dE)/d б=(Е^3-2Е^2+Е)/d +Е -1
Со временем мы сможем создать бета-функцию.

Все рейтинги выше этого, скорее всего, являются мошенничеством.

Если кому интересно, напишу подробнее.

Теги: #рейтинг #чит #математика #Алгоритмы #Разработка сайтов #Алгоритмы #математика

Вместе с данным постом часто просматривают: