Mengapa konvolusi bekerja?

11

Jadi saya tahu bahwa jika kita ingin menemukan distribusi probabilitas dari sejumlah variabel acak independen , kita dapat menghitungnya dari distribusi probabilitas dan , dengan mengatakanX+YXY

fX+Y(a)=x=fX,Y(X=x,Y=ax) dx=x=fX(x)fY(ax) dx

Secara intuitif, ini masuk akal, karena jika kita ingin menemukan probabilitas bahwa dua variabel acak dijumlahkan , pada dasarnya jumlah probabilitas semua peristiwa yang mengarah pada variabel-variabel tersebut menjumlahkan . Tetapi bagaimana saya bisa membuktikan pernyataan ini secara formal?aa

Jessica
sumber
Pertanyaan yang sedikit berbeda, tetapi jawabannya serupa .
Carl

Jawaban:

10

Solusi yang lebih umum mempertimbangkan mana dan belum tentu independen. Strategi solusi umum untuk masalah di mana Anda bertanya-tanya dari mana datangnya PDF atau bagaimana membenarkannya, adalah menemukan kumulatif sebagai gantinya, kemudian bedakan untuk mengurangi CDF menjadi PDF.X YZ=X+YXY

Sangat mudah untuk melihat bahwa dalam kasus itu mana adalah wilayah dari - pesawat yang .R x y x + y zFZ(z)=P(Zz)=RfX,Y(x,y)dxdyRxyx+yz

Ini adalah wilayah berwarna biru pada diagram di bawah ini. Wajar untuk berintegrasi di wilayah ini dengan memecahnya menjadi strip - Saya telah melakukannya dengan strip vertikal tetapi yang horizontal akan melakukannya. Secara efektif saya berakhir dengan strip untuk setiap koordinat , mulai dari hingga , dan di sepanjang setiap strip saya ingin nilai tidak naik di atas garis , jadi .- y x + y = z y z - xxyx+y=zyzx

z <x + y

Sekarang kita telah memperoleh batas integrasi dalam hal dan , kita dapat membuat substitusi , sebagai berikut, dengan tujuan membuat muncul sebagai batas atas . Matematika itu sederhana selama Anda memahami penggunaan Jacobian untuk mengubah variabel.xyu=xv=x+yzv

FZ(z)=x=x=y=y=zxfX,Y(x,y)dxdy=v=v=zu=y=fX,Y(u,vu)dudv

Selama kondisi tertentu terpenuhi kita dapat membedakan di bawah tanda integral sehubungan dengan untuk mendapatkan:z

fZ(z)=fX,Y(u,zu)du

Itu bekerja bahkan jika dan tidak independen. Tetapi jika mereka, kita dapat menulis ulang kepadatan bersama sebagai produk dari dua yang marjinal:XY

fZ(z)=fX(u)fY(zu)du

Dummy variabel bisa tanpa membahayakan ditulis sebagai jika diinginkan.xux

Notasi saya untuk integral persis mengikuti Bagian 6.4 dari Geoffrey Grimmett dan Dominic Walsh, Probabilitas: An Pendahuluan , Oxford University Press, New York, 2000.

Gegat
sumber
+1 Sebagai soal notasi, konvensi adalah bahwa diferensial di luar integral ganda berlaku untuk integral luar; dengan demikian, dalam ekspresi bentuk integrasi sehubungan dengan dilakukan terlebih dahulu - itu adalah integral dalam - dan yang berkaitan dengan dilakukan terakhir - itu adalah integral luar. Ini membuat kita bebas untuk menempatkan tanda kurung tanpa mengubah artinya, seperti di . dxdyxy(dx)dy
whuber
1
@whuber, memikirkannya, tentu saja itu adalah konvensi yang diterapkan di hampir setiap buku teks yang saya tahu (sehingga beberapa integrasi secara efektif bersarang integral). Tetapi membolak-balik, Grimmett dan Welsh "Probability: An Introduction" benar-benar konsisten dengan konvensi mereka sendiri dari urutan kiri-kanan yang sama untuk batas dan perbedaan, misalnya mereka memberikan ! uvw...dudvdw
Silverfish
Saya selalu terhibur dengan bagaimana, di persimpangan banyak bidang, kita dihadapkan pada konvensi yang saling bertentangan. Ini adalah salah satu kesenangan bekerja dengan orang-orang dari latar belakang yang berbeda.
whuber
@whuber Saya sadar bahwa konvensi untuk menetapkan integral sangat bervariasi di antara negara - Anda akan menikmati ini dari Tex SE tex.stackexchange.com/a/88961/25866 dan saya berharap itu diperluas untuk mencakup beberapa integrasi!
Silverfish
10

Pernyataan ini benar jika dan hanya jika sisi kanan bertindak seperti kepadatan untuk ; itu adalah,X+Y

FX+Y(a)=P(X+Ya)=afX+Y(z)dz=a(fX(x)fY(zx)dx)dz

untuk semua . Mari kita verifikasi ini dengan mulai dengan sisi kanan.a

Terapkan Teorema Fubini untuk mengubah urutan integrasi dan membuat substitusi . Penentu Jacobiannya adalah , jadi tidak ada istilah tambahan yang diperkenalkan oleh perubahan variabel ini. Perhatikan bahwa karena dan berada dalam korespondensi satu-ke-satu dan jika dan hanya jika , kita dapat menulis ulang integral sebagaiz=x+y1zy<za<y<ax

=(axfX(x)fY(y)dy)dx.

Menurut definisi ini adalah integral dari dariR2

=I(x+ya)fX(x)fY(y)dydx

di mana adalah fungsi indikator dari satu set. Akhirnya, karena dan adalah independen, untuk semua , mengungkapkan integral sebagai hanya harapanIXYf(X,Y)(x,y)=fX(x)fY(y)(x,y)

=I(x+ya)f(X,Y)(x,y)dydx=E(I(X+Ya))=P(X+Ya),

seperti yang diinginkan.


Lebih umum, bahkan ketika salah satu atau kedua atau tidak memiliki fungsi distribusi, kita masih bisa mendapatkanXY

FX+Y(a)=EX(FY(aX))=EY(FX(aY))

langsung dari definisi dasar, menggunakan ekspektasi indikator untuk bolak-balik antara probabilitas dan harapan dan mengeksploitasi asumsi independensi untuk memecah perhitungan menjadi ekspektasi terpisah sehubungan dengan dan :XY

P(X+Ya)=E(I(X+Ya))=EX(EY(I(X+Ya))=EX(PY(YaX))=EX(FY(aX)).

Ini termasuk formula biasa untuk variabel acak diskrit, misalnya, meskipun dalam bentuk yang sedikit berbeda dari biasanya (karena dinyatakan dalam istilah CDF daripada fungsi massa probabilitas).

Jika Anda memiliki teorema yang cukup kuat tentang interchanging turunan dan integral, Anda dapat membedakan kedua belah pihak sehubungan dengan untuk mendapatkan kepadatan dalam satu stroke,afX+Y

fX+Y(a)=ddaFX+Y(a)=EX(ddaFY(aX))=EX(fY(aX))=fX(x)fY(ax)dx.
whuber
sumber