Saya percaya bahwa plot kotak di bawah ini dapat diartikan sebagai "kebanyakan pria lebih cepat daripada kebanyakan wanita" (dalam dataset ini), terutama karena waktu rata-rata pria lebih rendah daripada waktu rata-rata wanita. Tapi tentu saja EDX pada R dan statistik kuis mengatakan kepada saya bahwa tidak benar. Tolong bantu saya memahami mengapa intuisi saya salah.
Inilah pertanyaannya:
Mari kita pertimbangkan sampel acak dari finishers dari New York City Marathon pada tahun 2002. Dataset ini dapat ditemukan dalam paket UsingR. Muat pustaka dan kemudian muat dataset nym.2002.
library(dplyr) data(nym.2002, package="UsingR")
Gunakan plot kotak dan histogram untuk membandingkan waktu penyelesaian pria dan wanita. Manakah dari berikut ini yang paling menggambarkan perbedaannya?
- Laki-laki dan perempuan memiliki distribusi yang sama.
- Sebagian besar pria lebih cepat daripada kebanyakan wanita.
- Pria dan wanita memiliki distribusi miring kanan yang sama dengan yang pertama, 20 menit bergeser ke kiri.
- Kedua distribusi biasanya didistribusikan dengan perbedaan rata-rata sekitar 30 menit.
Berikut adalah waktu maraton NYC untuk pria dan wanita, seperti kuantil, histogram, dan plot kotak:
# Men's time quantile
0% 25% 50% 75% 100%
147.3333 226.1333 256.0167 290.6375 508.0833
# Women's time quantile
0% 25% 50% 75% 100%
175.5333 250.8208 277.7250 309.4625 566.7833
Jawaban:
Saya pikir alasan Anda ditandai sebagai salah bukan karena jawaban yang Anda berikan pada pertanyaan multichoice salah, melainkan bahwa opsi 3 "Pria dan wanita memiliki distribusi condong ke kanan yang sama dengan yang sebelumnya, 20 menit bergeser ke kiri" akan menjadi pilihan yang lebih baik karena lebih informatif berdasarkan informasi yang diberikan.
sumber
Inilah contoh tandingan terkecil yang bisa saya temukan:
A (
[1, 4, 10])
dan B ([0, 6, 9]
) memiliki rata-rata yang sama (5
)B memiliki median yang lebih besar (
6
) daripada A (4
)Berikut contoh lain dengan 4 elemen:
sumber
Tentu saja interpretasi lain dari frase itu mungkin (itulah ambiguitas, dan semua kemungkinan lainnya mungkin konsisten dengan alasan Anda).
[Kami juga memiliki masalah apakah kita berbicara tentang sampel atau populasi ... "kebanyakan pria [...] kebanyakan wanita" tampaknya merupakan pernyataan populasi (tentang populasi waktu potensial) tetapi kami hanya mengamati waktu bahwa kita tampaknya memperlakukan sebagai sampel, jadi kita harus berhati-hati dengan seberapa luas kita membuat klaim.]
[Saya tidak mengatakan Anda salah dalam berpikir bahwa proporsi pasangan MF acak di mana pria lebih cepat daripada wanita lebih dari 1/2 - Anda hampir pasti benar. Saya hanya mengatakan Anda tidak bisa mengatakannya dengan membandingkan median. Anda juga tidak dapat mengatakannya dengan melihat proporsi pada setiap sampel di atas atau di bawah median sampel lainnya. Anda harus membuat perbandingan yang berbeda.]
Contoh:
Kumpulan data A:
Kumpulan data B:
Perangkat data C:
(Data ada di sini , tetapi digunakan untuk tujuan yang berbeda di sana - untuk ingatan saya, saya membuat ini sendiri)
Perhatikan bahwa proporsi A <B adalah 2/3, proporsi A <C adalah 5/9 dan proporsi B <C adalah 2/3. A vs B dan B vs C keduanya signifikan pada level 5% tetapi kita dapat mencapai tingkat signifikansi apa pun hanya dengan menambahkan salinan sampel yang cukup. Kita bahkan dapat menghindari ikatan, dengan menduplikasi sampel tetapi menambahkan jitter yang cukup kecil (cukup kecil dari celah terkecil di antara titik-titik)
Median sampel menuju ke arah lain: median (A)> median (B)> median (C)
Sekali lagi kita dapat mencapai signifikansi untuk beberapa perbandingan median - dengan tingkat signifikansi apa pun - dengan mengulangi sampel.
Untuk mengaitkannya dengan masalah saat ini, bayangkan A adalah "waktu wanita" dan B adalah "waktu pria". Maka waktu rata-rata pria lebih cepat, tetapi pria yang dipilih secara acak akan 2/3 waktunya lebih lambat daripada wanita yang dipilih secara acak.
Dengan mengambil isyarat kami dari sampel A dan C kami dapat menghasilkan set data yang lebih besar (dalam R) sebagai berikut:
Median F akan menjadi sekitar 16,25 sedangkan median M akan menjadi sekitar 11,25 tetapi proporsi kasus di mana F <M akan menjadi 5/9.
sumber
Gambar-gambar berikut diambil dari posting blog ini , yang menggambarkan aplikasi praktis penting dari ide-ide ini.
Standardisasi menyediakan perangkat yang kuat untuk membandingkan 2 distribusi. 3 angka berikut membandingkan ketinggian anak laki-laki dan perempuan berusia 130 bulan dari National Child Measurement Program (NCMP) Inggris. (Ini adalah usia modal dalam kumpulan data ini; Saya memilihnya hanya untuk mendapatkan data terbanyak, dan oleh karena itu plot yang paling halus, dalam kohort kelompok umur tunggal.)
Gambar 1: Ketinggian anak laki-laki dan perempuan berusia 130 bulan, dari National Child Measurement Programme (NCMP) Inggris
Gambar 2: Persentil tinggi badan untuk anak laki-laki dan perempuan berusia 130 bulan. Sumber: Bahasa Inggris NCMP
Gambar 3: Distribusi ketinggian anak perempuan berusia 130 bulan relatif terhadap anak laki-laki pada usia yang sama.
Pada angka-angka terakhir ini, perbandingan tinggi badan telah distandarisasi menurut ketinggian anak laki-laki. Dengan demikian, membaca sepanjang garis abu-abu putus-putusan pada Gambar 3, Anda dapat membuat pernyataan seperti:
Satu hal yang mungkin membingungkan dalam plot ini memang patut disebutkan. Meskipun garis 45 ° anak laki-laki 'lebih tinggi' di plot daripada kurva magenta anak perempuan, namun pengamatan ini sesuai dengan fakta yang diketahui bahwa pada usia ini (ini adalah siswa kelas 6), anak perempuan biasanya lebih tinggi daripada anak laki-laki. . Perhatikan bahwa ketinggian ini tercermin dengan baik pada kenyataan bahwa kurva magenta bergeser ke kanan relatif terhadap garis biru.
Pertanyaan awal Anda sekarang dapat disusun kembali dalam bentuk geometris, sebagai pertanyaan tentang apakah Anda dapat menggambar kurva magenta pada Gambar 3 untuk mencapai secara bersamaan (a) hubungan yang dipostulasikan antara median dan (b) hubungan yang agak sulit dipahami yang @Glen_b dijelaskan (benar, saya percaya) dalam jawabannya. Saya bertanya-tanya apakah diskontinuitas distribusi (titik massa dalam kepadatan) dapat memungkinkan kasus 'patologis' disediakan. Saya menduga bahwa kasus patologis semacam itu akan menjadi 'pengecualian yang membuktikan aturan'.
Di sisi lain, jika maksud sebenarnya dari 'sebagian besar' adalah "> 50%", orang mungkin mengharapkan ungkapan yang lebih tepat "mayoritas" telah digunakan. Jika seseorang mengatakan kepada saya sesuatu "mungkin" akan terjadi, saya akan berpikir probabilitas subjektif sebesar 60% atau lebih sedang disinggung. Demikian juga, "sebagian besar" bagi saya berarti sesuatu yang sedikit lebih seperti 70-80%. Jelas, dari plot di atas, jika 'sebagian besar' dianggap sebagai kriteria yang lebih ketat dari 52,5%, maka Anda tidak dapat mengatakan "kebanyakan anak perempuan [memiliki properti yang mereka] lebih tinggi daripada kebanyakan anak laki-laki." Saya bertanya-tanya apakah bagian dari alasan untuk pertanyaan kuis adalah untuk merangsang pemeriksaan kata-kata karena berkaitan dengan gagasan numerik. (Jika menurut Anda ini sedikit konyol, pertimbangkan grafik ini, menunjukkan bagaimana orang cenderung menafsirkan kata-kata dan frase probabilistik yang berbeda.) Mungkin maksudnya juga adalah untuk menggarisbawahi poin bahwa banyak variasi hadir dalam distribusi dunia nyata, dan bahwa satu statistik (median, rata-rata, apa yang dimiliki- Anda) jarang akan mendukung pernyataan luas dan luas.
sumber