Anda harus membagikan pemikiran Anda tentang masalahnya, terlepas dari kenyataan bahwa ini terlihat seperti pertanyaan belajar mandiri.
StubbornAtom
Jawaban:
7
Menggunakan notasi yang sedikit lebih eksplisit , di mana adalah bilangan real, bukan variabel acak. Himpunan di mana adalah lintasan berbentuk L dengan dua segmen setengah terbuka: satu lurus ke atas dari titik dan lainnya lurus ke kanan dari titik yang sama. Sudah jelas bahwa pada kaki vertikal, dan pada kaki horizontal .P(X<Y|min(X,Y)=m)mmin(X,Y)=m(m,m)x<yx>y
Dengan intuisi geometri ini, mudah untuk menulis ulang masalah dalam bentuk yang setara, di mana dalam pembilang kita hanya memiliki kaki vertikal di mana dan dalam penyebut kita memiliki jumlah dari kedua kaki.x<y
Jadi sekarang kita perlu menghitung dua ekspresi dari bentuk . Probabilitas kondisional dari distribusi normal bivariat seperti itu selalu memiliki distribusi normal dengan parameter:P(m<X|Y=m)N(μX|Y=m,s2X|Y=m)
μX|Y=m=μ1+σ12σ22(m−μ2)(2)
s2X|Y=m=σ11−σ212σ22(3)
Perhatikan bahwa dalam definisi masalah asli, merujuk elemen-elemen dari matriks kovarians, bertentangan dengan konvensi yang lebih umum menggunakan untuk deviasi standar. Di bawah ini, kita akan merasa lebih nyaman untuk menggunakan untuk varians dan untuk deviasi standar dari distribusi probabilitas bersyarat.σijσs2s
Mengetahui dua parameter ini, kita dapat menghitung probabilitas dari dari fungsi distribusi kumulatif.m<X
P(m<X|Y=m)=Φ(μX;Y=m−msX;Y=m)(4)
mutatis mutandis , kami memiliki ekspresi yang sama untuk . MembiarkanP(Y>m|X=m)
zX|Y=m=μX;Y=m−msX;Y=m(5)
dan
zY|X=m=μY;X=m−msY;X=m(6)
Kemudian kita dapat menulis solusi lengkap secara kompak dalam hal dua skor :z
Dalam (3) saya berpikir bahwa sisi kiri harus memiliki persegi, karena itu adalah varian bersyarat sementara standar deviasi digunakan nanti.
Yves
Anda benar @Yves, dan saya yakin suntingan saya baru-baru ini telah memperbaiki masalahnya. Terima kasih.
olooney
@olooney, terima kasih atas balasan ini. Saya bisa mengikuti derivasi dan sepertinya benar. Namun, saya mencoba memverifikasi (1) dan (7) dalam simulasi dan hasilnya sangat berbeda. Anda dapat melihat kode R saya di sini gist.github.com/mikeguggis/d041df05565f63f8be2c6c51f5cf8961
Jawaban:
Menggunakan notasi yang sedikit lebih eksplisit , di mana adalah bilangan real, bukan variabel acak. Himpunan di mana adalah lintasan berbentuk L dengan dua segmen setengah terbuka: satu lurus ke atas dari titik dan lainnya lurus ke kanan dari titik yang sama. Sudah jelas bahwa pada kaki vertikal, dan pada kaki horizontal .P(X<Y|min(X,Y)=m) m min(X,Y)=m (m,m) x<y x>y
Dengan intuisi geometri ini, mudah untuk menulis ulang masalah dalam bentuk yang setara, di mana dalam pembilang kita hanya memiliki kaki vertikal di mana dan dalam penyebut kita memiliki jumlah dari kedua kaki.x<y
Jadi sekarang kita perlu menghitung dua ekspresi dari bentuk . Probabilitas kondisional dari distribusi normal bivariat seperti itu selalu memiliki distribusi normal dengan parameter:P(m<X|Y=m) N(μX|Y=m,s2X|Y=m)
Perhatikan bahwa dalam definisi masalah asli, merujuk elemen-elemen dari matriks kovarians, bertentangan dengan konvensi yang lebih umum menggunakan untuk deviasi standar. Di bawah ini, kita akan merasa lebih nyaman untuk menggunakan untuk varians dan untuk deviasi standar dari distribusi probabilitas bersyarat.σij σ s2 s
Mengetahui dua parameter ini, kita dapat menghitung probabilitas dari dari fungsi distribusi kumulatif.m<X
mutatis mutandis , kami memiliki ekspresi yang sama untuk . MembiarkanP(Y>m|X=m)
dan
Kemudian kita dapat menulis solusi lengkap secara kompak dalam hal dua skor :z
Berdasarkan kode simulasi yang disediakan oleh penulis pertanyaan, kita dapat membandingkan hasil teoritis ini dengan hasil simulasi:
sumber
Pertanyaannya dapat ditulis ulang menggunakan versi teorema Bayes yang dimodifikasi (dan penyalahgunaan gagasan untuk )Pr
Tentukan sebagai PDF bivariat dari dan , dan . KemudianfX,Y X Y ϕ(x)=12π√exp(−12x2) Φ(x)=∫x−∞ϕ(t)dt
dan
Menggunakan normalitas dan definisi probabilitas kondisional, integand dapat ditulis ulang sebagai
dan
Di mana
dan
Jadi
Bentuk akhir ini sangat mirip dengan hasil yang diperoleh @olooney. Perbedaannya adalah probabilitasnya tidak tertimbang oleh kepadatan normal.
Skrip R untuk verifikasi numerik dapat ditemukan di sini
sumber