Misalkan Anda memiliki delapan pelari berlomba; distribusi waktu masing-masing berjalan adalah Normal dan masing-masing memiliki rata-rata detik, katakanlah. Standar deviasi pelari satu adalah yang terkecil, dua yang terkecil terkecil, ketiga terkecil, dll, dan delapan terbesar. Dua pertanyaan membingungkan saya: (1) Berapa probabilitas yang pertama mengalahkan yang terakhir, dan (2) siapa yang paling mungkin memenangkan lomba?
Jawaban saya masing-masing dan . Karena mereka memiliki rata-rata yang sama, probabilitas bahwa hanya , bukan? Bagaimana saya bisa mendemonstrasikan bagian kedua dengan seksama, dan dapatkah probabilitas pasti untuk menang dihitung? Terima kasih sebelumnya.8 ˉ x 1 - ˉ x 8 < 0
Jawaban:
Meskipun probabilitas pasti tidak dapat dihitung (kecuali dalam keadaan khusus dengan ), ini dapat dihitung secara cepat dengan akurasi tinggi. Terlepas dari keterbatasan ini, dapat dibuktikan dengan ketat bahwa pelari dengan standar deviasi terbesar memiliki peluang terbesar untuk menang. Angka tersebut menggambarkan situasi dan menunjukkan mengapa hasil ini jelas secara intuitif:n≤2
Kerapatan probabilitas untuk kali lima pelari ditampilkan. Semua kontinu dan simetris tentang rata-rata umum . (Kerapatan Beta berskala digunakan untuk memastikan semua waktu adalah positif.) Satu kerapatan, digambar dengan warna biru gelap, memiliki penyebaran yang jauh lebih besar. Bagian yang terlihat di ekor kirinya mewakili waktu yang biasanya tidak ada pelari lain yang cocok. Karena ekor kiri itu, dengan area yang relatif luas, mewakili probabilitas yang cukup besar, pelari dengan kepadatan ini memiliki peluang terbesar untuk memenangkan perlombaan. (Mereka juga memiliki peluang terbesar untuk datang terakhir!)μ
Hasil ini terbukti lebih dari sekadar distribusi normal: metode yang disajikan di sini berlaku sama baiknya untuk distribusi yang simetris dan kontinu. (Ini akan menarik bagi siapa saja yang keberatan untuk menggunakan distribusi Normal untuk memodelkan waktu berjalan.) Ketika asumsi ini dilanggar, mungkin saja pelari dengan deviasi standar terbesar mungkin tidak memiliki peluang terbesar untuk menang (saya meninggalkan konstruksi sampel tandingan ke pembaca yang tertarik), tetapi kita masih dapat membuktikan dengan asumsi yang lebih ringan bahwa pelari dengan SD terbaik akan memiliki peluang terbaik untuk menang asalkan SD cukup besar.
Gambar tersebut juga menunjukkan bahwa hasil yang sama dapat diperoleh dengan mempertimbangkan analog satu sisi dari standar deviasi (yang disebut "semivarian"), yang mengukur dispersi distribusi ke satu sisi saja. Pelari dengan dispersi luar biasa ke kiri (menuju waktu yang lebih baik) harus memiliki peluang lebih besar untuk menang, terlepas dari apa yang terjadi di sisa distribusi. Pertimbangan ini membantu kami menghargai bagaimana properti menjadi yang terbaik (dalam kelompok) berbeda dari properti lainnya seperti rata-rata.
Misalkan menjadi variabel acak yang mewakili waktu pelari. Pertanyaannya mengasumsikan mereka independen dan terdistribusi secara normal dengan rata-rata umum μ . (Meskipun ini secara harfiah merupakan model yang tidak mungkin, karena ia memiliki probabilitas positif untuk waktu negatif, itu masih bisa menjadi perkiraan yang masuk akal untuk kenyataan asalkan standar deviasi secara substansial lebih kecil dari μ .)X1,…,Xn μ μ
Untuk melaksanakan argumen berikut, pertahankan anggapan independensi tetapi anggap distribusi diberikan oleh F i dan bahwa undang-undang distribusi ini dapat berupa apa saja. Untuk kenyamanan, anggap juga distribusi F n kontinu dengan kepadatan f n . Kemudian, sesuai kebutuhan, kami dapat menerapkan asumsi tambahan asalkan itu termasuk kasus distribusi normal.Xi Fi Fn fn
Untuk setiap dan sangat kecil d y , peluang bahwa pelari terakhir memiliki waktu dalam interval ( y - d y , y ] dan merupakan pelari tercepat diperoleh dengan mengalikan semua probabilitas yang relevan (karena semua waktu independen):y dy (y−dy,y]
Mengintegrasikan semua kemungkinan yang saling eksklusif ini menghasilkan
Untuk distribusi normal, integral ini tidak dapat dievaluasi dalam bentuk tertutup ketika : perlu evaluasi numerik.n>2
Gambar ini memplot integand untuk masing-masing dari lima pelari yang memiliki standar deviasi dalam rasio 1: 2: 3: 4: 5. Semakin besar SD, semakin banyak fungsinya digeser ke kiri - dan semakin besar wilayahnya. Daerahnya sekitar 8: 14: 21: 26: 31%. Secara khusus, pelari dengan SD terbesar memiliki peluang menang 31%.
Meskipun formulir tertutup tidak dapat ditemukan, kami masih dapat menarik kesimpulan yang kuat dan membuktikan bahwa pelari dengan SD terbesar kemungkinan besar akan menang. Kita perlu mempelajari apa yang terjadi sebagai standar deviasi dari salah satu distribusi, mengatakan , perubahan. Ketika variabel acak X n diubah kembali dengan σ > 0 di sekitar rata-rata, SD-nya dikalikan dengan σ dan f n ( y ) d y akan berubah menjadi f n ( y / σ ) d y / σFn Xn σ>0 σ fn(y)dy fn(y/σ)dy/σ . Membuat perubahan variabel dalam integral memberikan ekspresi untuk peluang runner n menang, sebagai fungsi dari σ :y=xσ n σ
Anggaplah sekarang bahwa median dari semua distribusi adalah sama dan bahwa semua distribusi simetris dan kontinu, dengan kepadatan f i . (Ini tentu saja merupakan kasus di bawah kondisi pertanyaan, karena median Normal adalah rata-rata.) Dengan perubahan variabel sederhana (lokasi) kita dapat mengasumsikan median umum ini adalah 0 ; simetri berarti f n ( y ) = f n ( - y ) dan 1 - F j ( - y ) = F j ( yn fi 0 fn(y)=fn(−y) untuk semua y . Hubungan ini memungkinkan kita untuk menggabungkan integral atas ( - ∞ , 0 ] dengan integral atas ( 0 , ∞ ) untuk diberikan1−Fj(−y)=Fj(y) y (−∞,0] (0,∞)
Fungsi dapat dibedakan. Turunannya, diperoleh dengan membedakan integand, adalah jumlah integral di mana setiap istilah berbentukϕ
untuk .i=1,2,…,n−1
Asumsi yang kami buat tentang distribusi dirancang untuk memastikan bahwa untuk x ≥ 0 . Dengan demikian, karena x = y σ ≥ 0 , setiap istilah dalam produk kiri melebihi istilah yang sesuai dalam produk yang tepat, menyiratkan perbedaan produk adalah tidak negatif. Faktor-faktor lain y f n ( y ) f i ( y σ ) jelas tidak negatif karena kepadatan tidak boleh negatif danFj(x)≥1−Fj(x) x≥0 x=yσ≥0 yfn(y)fi(yσ) . Kita dapat menyimpulkan bahwa ϕ ′ ( σ ) ≥ 0 untuk σ ≥ 0 , membuktikan bahwapeluang bahwa pemain n menang meningkat dengan deviasi standar X n .y≥0 ϕ′(σ)≥0 σ≥0 n Xn
Ini cukup untuk membuktikan bahwa pelari akan menang asalkan standar deviasi X n cukup besar. Ini tidak cukup memuaskan, karena SD besar dapat menghasilkan model yang secara fisik tidak realistis (di mana waktu menang negatif memiliki peluang yang cukup besar). Tetapi anggaplah semua distribusi memiliki bentuk yang identik terlepas dari standar deviasi mereka . Dalam hal ini, ketika mereka semua memiliki SD yang sama, X i adalah independen dan terdistribusi secara identik: tidak ada yang dapat memiliki peluang menang lebih besar atau lebih kecil daripada siapa pun, sehingga semua peluang sama (untuk 1 / n ). Mulailah dengan mengatur semua distribusi ke runner nn Xn Xi 1/n n . Sekarang secara bertahap kurangi SD semua pelari lainnya, satu per satu. Ketika ini terjadi, peluang bahwa menang tidak dapat berkurang, sementara peluang semua pelari lainnya mengalami penurunan. Akibatnya, n memiliki peluang terbesar untuk menang, QED .n n
sumber