Ambil contoh peringkat buku di situs web. Buku A dinilai oleh 10.000 orang dengan peringkat rata - rata 4,25 dan varians . Demikian pula Buku B dinilai oleh 100 orang dan memiliki peringkat 4,5 dengan σ = 0,25 .
Sekarang karena ukuran sampel besar Buku A 'rata-rata stabil' menjadi 4,25. Sekarang untuk 100 orang, mungkin jika lebih banyak orang membaca Buku B peringkat rata-rata bisa turun menjadi 4 atau 4,25.
- bagaimana seharusnya seseorang menafsirkan perbandingan cara dari sampel yang berbeda dan apa kesimpulan terbaik yang bisa / harus diambil?
Misalnya - dapatkah kita benar-benar mengatakan Buku B lebih baik daripada Buku A.
t-test
mean
sample-size
PhD
sumber
sumber
Jawaban:
Untuk memperjelas poin saya tentang kekuatan, berikut ini adalah simulasi yang sangat sederhana yang ditulis untuk R:
Saya memikirkan hal ini dengan analogi. Jika Anda ingin mengetahui luas dari sebuah persegi panjang, dan batasnya tetap, maka area tersebut akan dimaksimalkan jika panjang dan lebarnya sama (yaitu, jika persegi panjang itu adalah persegi ). Di sisi lain, karena panjang dan lebar berbeda (karena persegi panjang menjadi memanjang), area tersebut menyusut.
sumber
set.seed()
fungsi akan memastikan Anda mendapatkan output yang identik. Beri tahu saya jika masih terlalu sulit untuk diikuti.Selain jawaban yang disebutkan oleh @gung yang merujuk Anda ke uji-t, sepertinya Anda mungkin tertarik dengan sistem peringkat Bayesian (misalnya, inilah diskusi ). Situs web dapat menggunakan sistem seperti itu untuk memberi peringkat item pesanan yang bervariasi dalam jumlah suara yang diterima. Pada dasarnya, sistem tersebut bekerja dengan menetapkan peringkat yang merupakan gabungan dari nilai rata-rata semua item ditambah rata-rata sampel peringkat untuk objek tertentu. Ketika jumlah peringkat meningkat, bobot yang ditetapkan untuk rata-rata untuk objek meningkat dan bobot yang ditetapkan untuk peringkat rata-rata dari semua item berkurang. Mungkin periksa rata-rata bayesian .
Tentu saja segala sesuatunya dapat menjadi jauh lebih kompleks karena Anda berurusan dengan berbagai masalah seperti penipuan pemberian suara, perubahan seiring waktu, dll.
sumber