Terima kasih sebelumnya karena membawa saya, saya bukan ahli statistik apa pun dan tidak tahu bagaimana menggambarkan apa yang saya bayangkan, jadi Google tidak membantu saya di sini ...
Saya menyertakan sistem peringkat dalam aplikasi web yang sedang saya kerjakan. Setiap pengguna dapat menilai setiap item tepat sekali.
Saya membayangkan skala dengan 4 nilai: "sangat tidak suka", "tidak suka", "suka", dan "sangat suka", dan saya telah merencanakan untuk menetapkan nilai-nilai ini masing-masing -5, -2, +2, dan +5 .
Sekarang, jika setiap item memiliki jumlah peringkat yang sama, maka saya akan cukup nyaman dengan sistem penilaian ini karena dengan jelas membedakan item yang paling disukai dan paling tidak disukai. Namun, item tidak akan memiliki jumlah peringkat yang sama, dan perbedaan antara jumlah suara pada foto yang berbeda mungkin cukup dramatis.
Dalam hal itu, membandingkan skor kumulatif pada dua item berarti bahwa item lama dengan banyak peringkat biasa-biasa saja akan memiliki skor yang jauh lebih tinggi daripada item baru yang luar biasa dengan suara lebih sedikit.
Jadi, hal jelas pertama yang saya pikirkan tentang kita untuk mengambil rata-rata ... tetapi sekarang jika suatu item hanya memiliki satu peringkat "+5" itu memiliki rata-rata yang lebih baik daripada item yang memiliki skor 99 "+5" peringkat dan peringkat 1 "+2". Secara intuitif itu bukan representasi akurat dari popularitas suatu barang.
Saya membayangkan masalah ini biasa terjadi dan kalian tidak perlu saya menceritakannya dengan lebih banyak contoh, jadi saya akan berhenti pada titik ini dan menguraikan komentar jika diperlukan.
Pertanyaan saya adalah:
- Apa jenis masalah yang disebut, dan adakah istilah untuk teknik yang digunakan untuk menyelesaikannya? Saya ingin tahu ini sehingga saya bisa membacanya.
- Jika Anda mengetahui ada sumber daya ramah awam tentang masalah ini, saya akan sangat menghargai tautan.
- Akhirnya, saya menghargai saran lain tentang cara mengumpulkan dan menganalisis data jenis ini secara efektif.
Saya akan mengambil pendekatan grafis. Sumbu x bisa menjadi peringkat rata-rata dan y bisa menjadi jumlah peringkat. Saya biasa melakukan ini dengan statistik olahraga untuk membandingkan kontribusi fenom muda dengan bintang veteran. Semakin dekat titik ke sudut kanan atas, semakin dekat ke ideal. Tentu saja, memutuskan item "terbaik" masih akan menjadi keputusan subyektif, tetapi ini akan memberikan beberapa struktur.
Jika Anda ingin memplot peringkat rata-rata terhadap variabel lain, maka Anda bisa mengatur jumlah peringkat sebagai variabel ketiga menggunakan ukuran gelembung, dalam plot gelembung - misalnya, dalam XL atau SAS.
sumber