How Not To Sort By Average Rating
Ratings gibt es auf vielen Webseiten. Auf Amazon kann man seinen Lieblingsbüchern mit 5 Sterne geben, in der IMDB kann man seine Lieblingsfilme mit bis zu 10 Sternen auszeichnen und Webseiten nach der Machart von ciao.com ermöglichen es, alle erdenklichen Produkte und Dienstleistungen zu bewerten. Unbestritten eine feine Sache, die unser Leben erheblich beeinflusst, manchen von uns erleichtern solche Bewertungen anstehende Entscheidungen, andere finden sich in diesem Bewertungswald gar nicht mehr so recht zurecht.
Um die Auswahl zu erleichtern, gibt es Bestenlisten. Aber wie sortiert man die Ergebnisse, also welche Artikel sollen in der Liste oben stehen und welche unten? Eine naive Implementierung könnte einfach das durchschnittliche Rating der einzelnen Artikel vergleichen. Dass das keine gute Idee ist, leuchtet schnell ein: Hat ein Artikel nur eine einzige maximal gute Bewertung, verdrängt er meistens alle anderen Artikel, für die viel mehr Bewertungen abgegeben wurdne, von den oberen Plätzen, weil es ungleich schwerer ist, ein sehr gutes Durchschnittsranking zu erzielen. Irgendwie muss also die Anzahl der Bewertungen in das Ranking miteinfließen.
Um dieses Problem in den Griff zu bekommen, muss man sich ein wenig mit Statistik befassen, aber zum Glück gibt es schon eine fertige Lösung. In How Not To Sort By Average Rating zeigt Evan Miller, wie man das Wilson-Score-Konfidenzintervall anwenden muss, um eine vernünftige Sortierung zu bekommen.
[via twitter]







1 Kommentar