Jika saya mengerti benar, peringkat buku pada skala 1-5 adalah skor Likert. Artinya, angka 3 bagi saya belum tentu menjadi angka 3 untuk orang lain. Ini adalah IMO skala ordinal. Seseorang seharusnya tidak benar-benar skala ordinal tetapi pasti dapat mengambil mode, median dan persentil.
Jadi, bolehkah membengkokkan aturan karena sebagian besar penduduk memahami cara daripada statistik di atas? Meskipun komunitas riset sangat menghardik mengambil rata-rata data berdasarkan skala Likert, apakah boleh melakukan ini dengan massa (secara praktis berbicara)? Apakah mengambil rata-rata dalam kasus ini bahkan menyesatkan untuk memulai?
Tampaknya tidak mungkin bahwa perusahaan seperti Amazon akan mencari-cari statistik dasar, tetapi jika tidak maka apa yang saya lewatkan di sini? Bisakah kita mengklaim bahwa skala ordinal adalah perkiraan yang mudah untuk ordinal untuk membenarkan mengambil mean? Atas dasar apa?
sumber
Jawaban:
Manfaat menggunakan mean untuk meringkas kecenderungan sentral dari peringkat 5 poin
Seperti @gung sebutkan, saya pikir sering ada alasan yang sangat baik untuk mengambil rata-rata item lima poin sebagai indeks kecenderungan sentral. Saya sudah menguraikan alasan-alasan ini di sini .
Mengutip:
Mengapa rata-rata baik untuk Amazon
Pikirkan tentang tujuan Amazon dalam melaporkan rata-rata. Mereka mungkin bertujuan
Amazon menyediakan semacam rata-rata bulat, jumlah frekuensi untuk setiap opsi peringkat, dan ukuran sampel (yaitu, jumlah peringkat). Informasi ini mungkin cukup bagi kebanyakan orang untuk menghargai sentimen umum mengenai item tersebut dan kepercayaan pada peringkat seperti itu (yaitu, 4,5 dengan 20 peringkat lebih cenderung akurat daripada 4,5 dengan 2 peringkat; item dengan 10 5 peringkat-bintang, dan satu peringkat bintang-1 tanpa komentar mungkin masih merupakan barang bagus).
Anda bahkan dapat melihat nilai tengah sebagai pilihan demokratis. Banyak pemilihan diputuskan berdasarkan kandidat mana yang mendapatkan nilai rata-rata tertinggi dalam skala dua poin. Demikian pula, jika Anda mengambil argumen bahwa setiap orang yang mengirimkan ulasan mendapat suara, maka Anda dapat melihat mean sebagai bentuk yang menimbang suara setiap orang secara setara.
Apakah perbedaan dalam penggunaan skala benar-benar masalah?
Ada berbagai macam peringkat bias yang dikenal dalam literatur psikologis (untuk ulasan, lihat Saal et al 1980), seperti bias kecenderungan pusat, bias keringanan hukuman, bias ketat. Juga, beberapa penilai akan lebih sewenang-wenang dan beberapa akan lebih dapat diandalkan. Beberapa bahkan mungkin secara sistematis berbohong memberikan ulasan positif palsu atau negatif palsu. Ini akan membuat berbagai bentuk kesalahan ketika mencoba menghitung nilai rata-rata sebenarnya untuk suatu item.
Namun, jika Anda mengambil sampel acak dari populasi, bias semacam itu akan dibatalkan, dan dengan ukuran sampel yang cukup dari penilai, Anda masih akan mendapatkan nilai sebenarnya.
Tentu saja, Anda tidak mendapatkan sampel acak di Amazon, dan ada risiko bahwa serangkaian penilai yang Anda dapatkan untuk suatu item secara sistematis bias menjadi lebih lunak atau ketat dan sebagainya. Yang mengatakan, saya pikir pengguna Amazon akan menghargai bahwa peringkat yang dikirimkan pengguna berasal dari sampel yang tidak sempurna. Saya juga berpikir bahwa sangat mungkin bahwa dengan ukuran sampel yang masuk akal bahwa dalam banyak kasus, sebagian besar perbedaan bias respons akan mulai menghilang.
Kemungkinan ada kemajuan di luar rata-rata
Dalam hal meningkatkan akurasi peringkat, saya tidak akan menantang konsep umum rata-rata, tetapi saya pikir ada cara lain untuk memperkirakan peringkat rata-rata populasi sebenarnya untuk suatu barang (yaitu, nilai rata-rata yang akan diperoleh adalah sampel representatif besar yang diminta untuk menilai item).
Jadi, jika akurasi dalam peringkat adalah tujuan utama Amazon, saya pikir itu harus berusaha untuk meningkatkan jumlah peringkat per item dan mengadopsi beberapa strategi di atas. Pendekatan semacam itu mungkin sangat relevan ketika menciptakan peringkat "terbaik". Namun, untuk peringkat sederhana pada halaman, mungkin berarti sampel lebih baik memenuhi tujuan kesederhanaan dan transparansi.
Referensi
sumber
Untuk menjadi agak teknis di sini, peringkat itu sebenarnya bukan skala Likert ; mereka hanya peringkat ordinal. Sekarang, setelah mengatakan itu, poin Anda pada dasarnya benar. Namun, saya sering berpikir terlalu banyak dibuat dari masalah ini. Satu hal yang perlu diperhatikan adalah bahwa biasanya dipahami bahwa rata-rata sejumlah item ordinal dapat kira-kira interval, dan dengan demikian, ketika ada banyak peringkat mean menjadi representasi yang lebih masuk akal. Saya telah menemukan jawaban ini oleh @JeromyAnglim sebagai sangat baik (benar-benar, pertanyaan dan semua jawaban yang ada di sana layak dibaca). Untuk perawatan yang lebih teoretis, lihat di sini. Pada catatan yang berbeda, saya suka Amazon, tetapi saya tidak melihat alasan untuk mengharapkan kecanggihan statistik dari mereka, terutama dalam hal desain situs dasar - intinya adalah kegunaan oleh konsumen, bukan untuk mengesankan profesor statistik.
sumber
Setiap orang memiliki pendapat yang bagus tentang ini. Saya tidak berpikir saya bisa menambahkan lebih banyak. Namun, saya akan memposting ini :
sumber
Dalam pengalaman saya, rata-rata data skala-peringkat seringkali paling erat berkorelasi dengan tingkat metrik dunia nyata yang kami coba kaitkan dengan skala peringkat. Kami telah menemukan banyak hubungan linier, dan karena itu rata-rata adalah salah satu cara yang lebih baik untuk merangkum data. Karena itu, seperti yang ditunjukkan Jeromy, sebagian besar cara menganalisis kecenderungan sentral dari skala peringkat akan memberikan hasil yang serupa (peringkat pesanan, dll) sebagian besar waktu.
Juga, saya curiga Amazon mungkin tidak terlalu mementingkan validitas ilmiah. Tujuan Amazon, pada akhirnya, adalah membuat orang untuk berbelanja lebih banyak di Amazon.com, dan cara ulasan membantu mencapainya yang mungkin tidak akan berbeda dengan ringkasan satu angka apa pun yang digunakan. Produk yang baik akan dihargai, produk yang sangat buruk dihukum, dan pembeli yang gelisah akan memiliki kesempatan untuk meninjau pro dan kontra secara lebih rinci.
sumber
Peringkat Amazon menyesatkan karena perusahaan yang menggunakan sistem ini. Ketika pelanggan ditawari potongan harga dan barang dagangan gratis sebagai imbalan untuk ulasan bintang 5, "statistik" dari apa jumlah peringkat atau artinya menjadi diperdebatkan.
sumber
Anda membuat poin yang bagus. Mengambil rata-rata bilangan ordinal agak menyesatkan. Setiap ringkasan dari beberapa peringkat akan menderita dari fakta bahwa 3 subyektif saya mungkin benar-benar sama dengan 4. Jadi, menggabungkan skor individu yang berbeda mungkin merupakan masalah terbesar. Menafsirkan rata-rata dari 3 dan 4 sebagai 3,5 tidak hampir sama mengerikannya.
sumber