Saya tertarik dengan temuan makalah ini dari 2009:
Makalah ini mencoba menjelaskan mengapa pemain catur pria terbaik tampak jauh lebih baik daripada pemain wanita terbaik (wanita hanya membuat 2% dari 1.000 pemain terbaik dunia). Secara khusus, mereka mengklaim bahwa perbedaan besar antara pria catur terbaik dan pemain catur wanita terbaik sepenuhnya dijelaskan oleh 2 fakta:
- Ada 15 kali lebih banyak pria daripada pemain catur wanita
- Kami berharap rasio ini akan diperburuk pada ujung ekstrem dari distribusi, seluruhnya karena alasan statistik. Mengutip makalah:
Bahkan jika dua kelompok memiliki rata-rata (rata-rata) dan variabilitas (sd) yang sama, individu dengan kinerja tertinggi lebih mungkin berasal dari kelompok yang lebih besar. Semakin besar perbedaan ukuran antara kedua kelompok, semakin besar perbedaan yang diharapkan antara pemain berkinerja terbaik di kedua kelompok
Dan lagi,
Studi ini menunjukkan bahwa perbedaan besar dalam kinerja teratas pemain catur pria dan wanita sebagian besar dapat dikaitkan dengan fakta statistik sederhana — nilai yang lebih ekstrem ditemukan dalam populasi yang lebih besar.
Jadi, menurut penulis, jika hanya 6% dari pemain catur adalah wanita, maka kita hanya akan mengharapkan 2% dari mereka dalam 1000 teratas, jadi tidak ada penjelasan lain mengenai perbedaan biologis atau bias sosial yang diperlukan.
Pertanyaan saya
Saya tidak dapat memahami pikiran bahwa perbedaan kecil dalam ukuran populasi diperburuk pada ujung ekstrim distribusi. Secara khusus, apa yang salah dengan contoh-contoh ini:
Sekitar 1 dari 12 pemain catur lahir di bulan Januari. Jadi mereka membuat sebagian kecil dari semua pemain catur. Dengan metode statistik ini, kami berharap mereka akan kurang terwakili di level tertinggi - mungkin hanya 1 dari 30 pemain top yang akan lahir pada Januari. Tapi tentu saja Anda bisa menerapkan logika yang sama ini setiap bulan, dan Anda akhirnya mencapai kesimpulan yang tidak masuk akal.
Tampak bagi saya bahwa jika Anda membagi populasi menjadi 2 kelompok, Anda akan mengharapkan rasio pemain yang sama di semua ujung skala.
Ketika saya menentang hasil dari makalah yang diterbitkan, saya kira saya harus bertanya - apa yang saya lakukan salah?
Jawaban:
Saya pikir Anda salah membaca makalah, mereka tidak mengklaim apa yang Anda katakan. Klaim mereka tidak didasarkan pada jumlah pemain top, tetapi pada peringkat mereka . Jika distribusi kekuatan secara statistik sama antara pria dan wanita, maka jumlah wanita yang diharapkan di antara 100 teratas adalah 6, jika proporsi mereka dari total populasi adalah 6%. Beberapa kutipan dari koran:
Itu memang benar. Anda akan mengharapkan peringkat pria terbaik berada di atas peringkat wanita terbaik. Makalah ini melanjutkan untuk mencoba menghitung berapa banyak, hasil yang akan sangat bergantung pada distribusi yang diasumsikan.
Pada bagian 3, hasilnya, mereka melanjutkan untuk memasangkan pria terbaik dengan wanita terbaik, sama untuk terbaik berikutnya, dan seterusnya, untuk 100 pasangan pertama tersebut. Kemudian mereka menghitung selisih peringkat, dan membandingkannya dengan selisih peringkat yang diharapkan mengingat fakta bahwa ada lebih banyak pemain pria daripada wanita. Semua ini tampaknya benar, dan sangat berbeda dari cara Anda menyajikannya. Mungkin saja analisis mereka sedikit kuat, dan bahwa analisis yang lebih menyeluruh bisa dilakukan, tetapi ide dasar mereka benar.
sumber