Saya membuat halaman Web yang menarik hasil medali Olimpiade langsung dari Thompson Reuters dan jumlah populasi di seluruh dunia dari CIA.
Hasilnya menarik bagi saya - Hongaria memiliki angka dua digit dalam medali emas di seluruh dunia. Juga, AS dan Cina berada di dekat bagian bawah di hampir setiap kategori.
Pertanyaan saya adalah - apakah saya menyajikan data secara adil? Saya hanya mengambil populasi terbesar kemudian menciptakan faktor untuk masing-masing negara berdasarkan itu. Kolom penghitungan medali relatif didasarkan pada faktor itu.
Kolom apa yang bisa saya tambahkan? Apa faktor lain yang bisa saya tambahkan untuk menyajikan pandangan paling adil? Tampilan absolutnya mudah - Reuters melakukan itu. Bagaimana cara membuat tampilan yang adil?
sumber
Jawaban:
Anda mencoba menemukan perkiraan peluang individu mana pun untuk memenangkan medali, mengetahui bahwa "data" yang kami miliki hanyalah angka per negara. Ini adalah pertanyaan bagus solusi yang adil untuk menjadi lebih dekat dengan semangat Olimpiade.
Pada dasarnya, ini adalah masalah statistik yang diperkirakan dengan baik oleh metode Anda sebagai jumlah rata-rata (frekuensi) medali (untuk setiap warna) relatif terhadap populasi. Tetapi seberapa andal metode ini? Ini cukup dekat dengan masalah estimasi keandalan lemparan binomial dari berbagai jumlah lemparan yang memiliki aplikasi misalnya untuk membandingkan kualitas reseller di Amazon berdasarkan nomor umpan balik yang berbeda (lihat penjelasan menyeluruh ini ).
Dalam kasus khusus ini, jumlah populasi selalu cukup untuk membuat perkiraan distribusi beta dengan normal - sedemikian rupa sehingga memungkinkan untuk membandingkan signifikansi masing-masing estimasi untuk setiap negara.
sumber