Mengapa distribusi probabilitas berlipat ganda di sini?

9

Misalkan adalah jumlah hari Anda yang tersisa untuk hidup. Dokter 1 mengevaluasi distribusi sebagai Gaussian: . Dokter independen lain 2 mengevaluasi . Kedua dokter sama-sama andal. Bagaimana cara menggabungkan kedua informasi tersebut?XXP(X)N(μ1,σ1)P(X)N(μ2,σ2)

Dalam artikel blog ini , penulis mengatakan itu

Jika kita memiliki dua probabilitas dan kita ingin tahu peluang bahwa keduanya benar, kita hanya mengalikannya. Jadi, kami mengambil dua gumpalan Gaussian dan mengalikannya: masukkan deskripsi gambar di sini

Sunting Kebanyakan orang (saya pertama kali menanyakan pertanyaan ini pada math.SE) telah menjawab bahwa ini adalah hubungan independensi sepele tetapi saya masih kesulitan memahami apa yang akan dan berada dalam konteks ini: mungkin bukan peristiwa seperti "dadu akan memberikan 3" atau "pasien sakit". Juga, mungkin ada sesuatu yang lebih, karena produk dari dua densitas bukan kepadatan probabilitas karena secara umum . Jadi mungkin tidak sesederhana itu.P(AB)=P(A)P(B)ABRP(x)21

Mari kita ambil contoh lain. Seorang pakar 1 memberi tahu Anda bahwa dadu seimbang sempurna. Pakar lain 2 memberi tahu Anda, secara independen sama. Maka probabilitas dadu memberi angka 3 tentu bukan .1/62

dan dipahami
sumber

Jawaban:

8

Operasi-operasi ini dilakukan berdasarkan kemungkinan daripada probabilitas. Meskipun perbedaannya mungkin halus, Anda mengidentifikasi aspek krusial darinya: produk dari dua kepadatan tidak pernah menjadi kepadatan.

Bahasa di blog mengisyaratkan ini - tetapi pada saat yang sama membuatnya salah - jadi mari kita menganalisisnya:

Rata-rata distribusi ini adalah konfigurasi yang kemungkinan besar kedua perkiraannya, dan karenanya merupakan tebakan terbaik dari konfigurasi sebenarnya mengingat semua informasi yang kami miliki.

  1. Kami telah mengamati bahwa produk tersebut bukan distribusi. (Meskipun bisa diubah menjadi satu melalui perkalian dengan nomor yang sesuai, bukan itu yang terjadi di sini.)

  2. Kata-kata "perkiraan" dan "tebakan terbaik" menunjukkan bahwa mesin ini digunakan untuk memperkirakan parameter - dalam hal ini, "konfigurasi sebenarnya" (koordinat x, y).

  3. Sayangnya, rata-rata adalah tidak perkiraan terbaik. The modus ini. Ini adalah Prinsip Maximum Likelihood (ML).

Agar penjelasan blog masuk akal, kita harus menganggap yang berikut ini. Pertama, ada lokasi yang benar dan pasti. Sebut saja secara abstrak . Kedua, setiap "sensor" tidak melaporkan . Sebaliknya itu melaporkan nilai yang mungkin dekat dengan . Sensor "Gaussian" memberikan kepadatan probabilitas untuk distribusi . Agar sangat jelas, kepadatan untuk sensor adalah fungsi , tergantung pada , dengan properti yang untuk setiap wilayah (dalam pesawat), kemungkinan sensor akan melaporkan nilai dalam adalahμμXiμXiifiμRR

Pr(XiR)=Rfi(x;μ)dx.

Ketiga, kedua sensor diasumsikan beroperasi dengan kemandirian fisik , yang diambil untuk menyiratkan kemandirian statistik .

Menurut definisi, kemungkinan dari dua pengamatan adalah kepadatan probabilitas yang akan mereka miliki di bawah distribusi bersama ini, mengingat lokasi sebenarnya adalah . Asumsi independensi menyiratkan bahwa itu adalah produk dari kepadatan. Untuk memperjelas titik halus,x1,x2μ

  1. Fungsi produk yang ditunjuk untuk observasi adalah tidak kepadatan probabilitas untuk ; namun,f1(x;μ)f2(x;μ)xx

  2. Produk adalah densitas gabungan untuk pasangan yang dipesan .f1(x1;μ)f2(x2;μ)(x1,x2)

Dalam gambar yang diposting, adalah pusat dari satu gumpalan, adalah pusat dari yang lain, dan titik-titik dalam ruangnya mewakili nilai yang mungkin dari . Perhatikan bahwa baik maupun tidak bermaksud mengatakan apa pun tentang probabilitas ! hanyalah nilai tetap yang tidak diketahui . Itu bukan variabel acak.x1x2μf1f2μμ

Berikut ini adalah sentuhan halus lainnya: kemungkinan dianggap sebagai fungsi . Kami memiliki data - kami berada hanya mencoba untuk mencari tahu apa mungkin akan. Jadi, apa yang kita perlu rencanakan adalah fungsi kemungkinanμμ

Λ(μ)=f1(x1;μ)f2(x2;μ).

Ini adalah kebetulan tunggal bahwa ini juga kebetulan seorang Gaussian! Demonstrasi terbuka. Mari kita lakukan perhitungan matematika hanya dalam satu dimensi (bukan dua atau lebih) untuk melihat polanya - semuanya digeneralisasikan ke lebih banyak dimensi. Logaritma seorang Gaussian memiliki bentuk

logfi(xi;μ)=AiBi(xiμ)2

untuk konstanta dan . Jadi kemungkinan log adalahAiBi

logΛ(μ)=A1B1(x1μ)2+A2B2(x2μ)2=C(B1+B2)(μB1x1+B2x2B1+B2)2

di mana tidak bergantung pada . Ini adalah log dari Gaussian di mana peran telah digantikan oleh rata-rata tertimbang yang ditunjukkan pada fraksi.Cμxi

Mari kita kembali ke utas utama. Perkiraan ML adalah nilai yang memaksimalkan kemungkinan. Secara setara, ini memaksimalkan Gaussian yang baru saja kita peroleh dari produk Gaussians. Menurut definisi, maksimum adalah mode . Ini adalah kebetulan - yang dihasilkan dari titik simetri dari masing-masing Gaussian di sekitar pusatnya - bahwa mode terjadi bertepatan dengan mean.μ


Analisis ini telah mengungkapkan bahwa beberapa kebetulan dalam situasi tertentu telah mengaburkan konsep yang mendasarinya:

  • distribusi multivariat (gabungan) dengan mudah dikacaukan dengan distribusi univariat (yang bukan);

  • kemungkinannya tampak seperti distribusi probabilitas (yang bukan);

  • produk dari Gaussians adalah Gaussian (keteraturan yang umumnya tidak benar ketika sensor bervariasi dalam cara non-Gaussian);

  • dan mode mereka terjadi bertepatan dengan rata-rata mereka (yang dijamin hanya untuk sensor dengan respons simetris di sekitar nilai sebenarnya).

Hanya dengan berfokus pada konsep-konsep ini dan melepaskan perilaku-perilaku kebetulan kita dapat melihat apa yang sebenarnya terjadi.

whuber
sumber
1
Terima kasih banyak atas jawaban yang luar biasa ini. Tampaknya pertanyaannya tidak sesederhana kelihatannya. Saya benar-benar bertanya-tanya mengapa sangat sulit bagi saya untuk memahami konsep kemandirian yang saya pikir saya ketahui dengan baik. Saya akan meluangkan waktu untuk memastikan setiap poin jelas.
anderstood
2
Hadiah virtual +150. Saat Anda menulis "produk dari dua densitas tidak pernah merupakan densitas", bagaimana dengan densitas seragam pada , atau densitas yang dikumpulkan dalam 0? Bukankah (bahkan) lebih baik mengatakan " secara umum bukan kepadatan"? [0,1]
anderstood
1
Kamu benar. Saya memikirkan sebuah ketidaksetaraan yang bisa menjadi kesetaraan ketika semua nilai kerapatan adalah nol, satu, atau tak terbatas. Contoh tandingan Anda semuanya dari tipe itu.
whuber
6

Saya sudah melihat jawaban yang bagus tapi saya hanya memposting milik saya karena saya sudah mulai menulisnya.

Dokter 1 memiliki model prediksi ini:d1N(μ1,σ1)

Dokter 2 memiliki model prediksi ini:d2N(μ2,σ2)

Jadi, agar kita dapat mengevaluasi probabilitas gabungan kita hanya perlu menyadari bahwa ini menjadi faktor dalam karena karena independensi kedua dokter.P(d1,d2)=P(d1|d2)P(d2)P(d1)P(d2)P(d1|d2)=P(d1)

Mike
sumber
2
Virtual +1 untuk detail yang rapi. Sayang sekali sistem tidak mengizinkan saya memberi Anda +1 asli.
Keberuntungan
Bagaimana Anda mendefinisikan sebagai suatu peristiwa? Misalnya "dadu memberi angka 3" adalah sebuah peristiwa, demikian pula "menangkan lebih dari 100". Di sini saya tidak dapat memformulasikannya sedemikian rupa, karena tidak memiliki pfd, ini adalah pfd. Misalnya saya dapat menghitung probabilitas bahwa saya memiliki hari untuk hidup menurut dokter 1, tetapi berapa probabilitas ? d1d1xd1
anderstood
Mungkin saya bingung karena saya mengerti sebagai suatu peristiwa, sementara itu adalah variabel acak. Kemudian, adalah variabel acak yang menggambarkan jumlah hari tersisa menurut Dokter 1. Tetapi apa arti probabilitas gabungan dari dan apakah itu bilangan real dalam ? Bagaimana jika mengambil nilai "3 hari" dan mengambil nilai "4 hari"? Saya harap pertanyaan saya akan membantu Anda melakukan apa yang saya lewatkan. d1d1P(d1,d2)[0,1]d1d2
anderstood
2
Karena Gaussians adalah kepadatan probabilitas , bukan probabilitas, penjelasan ini tidak lengkap.
whuber