Berapa distribusi jumlah varian gaussian non iid?

36

Jika didistribusikan , didistribusikan dan , saya tahu bahwa didistribusikan jika X dan Y independen.N ( μ X , σ 2 X ) Y N ( μ Y , σ 2 Y ) Z = X + Y Z N ( μ X + μ Y , σ 2 X + σ 2 Y )XN(μX,σX2)YN(μY,σY2)Z=X+YZN(μX+μY,σX2+σY2)

Tetapi apa yang akan terjadi jika X dan Y tidak independen, yaitu (X,Y)N((μXμY),(σX2σX,YσX,YσY2))

Apakah ini mempengaruhi bagaimana jumlah didistribusikan?Z

JCWong
sumber
7
Hanya ingin menunjukkan bahwa ada segala macam distribusi bersama untuk (X,Y) lainnya dari normal bivariat yang masih memiliki X dan Y sedikit normal. Dan perbedaan ini akan membuat perbedaan besar pada jawabannya.
2
@ G.JayKerns Saya setuju bahwa jika dan adalah normal tetapi tidak harus bersama-sama normal, maka dapat memiliki distribusi selain normal. Tetapi pernyataan OP bahwa " didistribusikan jika dan independen." Benar sekali. Jika dan secara garis besar normal (seperti yang dikatakan bagian pertama kalimat) dan independen (seperti asumsi pada bagian kedua kalimat), maka keduanya juga secara normal normal. Dalam OP pertanyaan , normalitas bersama diasumsikan eksplisit dan setiap kombinasi linear dariXYX+YZN(μx+μy,σx2+σy2)XYXYX dan adalah normal. Y
Dilip Sarwate
3
@Dilip, izinkan saya menjelaskan bahwa tidak ada yang salah dengan pertanyaan dan tidak ada yang salah dengan jawaban Anda (+1) (atau probabilitas, salah (+1)). Saya hanya menunjukkan bahwa jika dan tergantung maka tidak perlu bahwa mereka secara normal normal, dan tidak jelas bahwa OP telah mempertimbangkan kemungkinan itu. Selain itu, saya takut (walaupun saya tidak menghabiskan banyak waktu untuk berpikir) bahwa tanpa beberapa asumsi lain (seperti normalitas bersama) pertanyaannya mungkin bahkan tidak dapat dijawab. XY
5
Seperti yang dikatakan @ G.JayKerns, tentu saja kita bisa mendapatkan segala macam perilaku menarik jika kita mempertimbangkan secara marginal, tetapi tidak secara bersama-sama, mendistribusikan normals. Berikut ini adalah contoh sederhana: Misalkan menjadi standar normal dan dengan probabilitas 1/2 masing-masing, secara independen dari . Misalkan . Maka juga standar normal, tetapi persis sama dengan nol dengan probabilitas 1/2 dan sama dengan dengan probabilitas 1/2. Xε=±1XY=εXYZ=X+Y2X
kardinal
4
Kita bisa mendapatkan berbagai macam perilaku yang berbeda dengan mempertimbangkan kopula bivariat yang dikaitkan dengan melalui teorema Sklar . Jika kita menggunakan Gaussian copula, maka kita mendapatkan secara bersama-sama normal, sehingga terdistribusi secara normal. Jika kopula bukan Gaussian copula, maka dan Y masing-masing masih terdistribusi secara marginal sebagai normals, tetapi tidak secara bersama-sama normal sehingga jumlah tidak akan terdistribusi secara normal, secara umum. ( X , Y ) Z = X + Y X(X,Y)(X,Y)Z=X+YXY
kardinal

Jawaban:

30

Lihat komentar saya pada jawaban probabilityislogic untuk pertanyaan ini . Di sini, dimanaσX,YadalahkovariansdariXdanY. Tidak ada yang menulis entri off-diagonal dalam matriks kovarians sebagaiσ 2 x y seperti yang Anda lakukan. Entri off-diagonal adalah kovarian yang bisa negatif.

X+YN(μX+μY,σX2+σY2+2σX,Y)aX+bYN(aμX+bμY,a2σX2+b2σY2+2abσX,Y)
σX,YXYσxy2
Dilip Sarwate
sumber
1
@Kodiologis Terima kasih! Saya terkejut bahwa kesalahan ketik tetap diperhatikan selama lebih dari 4 tahun.
Dilip Sarwate
29

@ dilip jawaban sudah cukup, tetapi saya hanya berpikir saya akan menambahkan beberapa detail tentang bagaimana Anda sampai pada hasilnya. Kita dapat menggunakan metode fungsi karakteristik. Untuk setiap berdimensi normal multivariate distribusi X ~ N d ( μ , Σ ) dimana μ = ( μ 1 , ... , μ d ) T dan Σ j k = c o v ( X j , X kdXNd(μ,Σ)μ=(μ1,...,μd)T , fungsi karakteristik diberikan oleh:Σjk=cov(Xj,Xk)j,k=1,,d

=exp(i d Σ j=1tjμj-1

φX(t)=E[exp(itTX)]=exp(itTμ12tTΣt)
=exp(ij=1dtjμj12j=1dk=1dtjtkΣjk)

Untuk variabel normal satu dimensi kita dapatkan:YN1(μY,σY2)

φY(t)=exp(itμY12t2σY2)

Sekarang, misalkan kita mendefinisikan sebuah variabel acak yang baru . Untuk kasus Anda, kami telah d = 2 dan a 1 = a 2 = 1 . Fungsi karakteristik Z adalah pada dasarnya sama dengan yang untuk X .Z=aTX=j=1dajXjd=2a1=a2=1ZX

= exp ( i t d alue j = 1 a j μ j - 1

φZ(t)=E[exp(itZ)]=E[exp(itaTX)]=φX(ta)
=exp(itj=1dajμj12t2j=1dk=1dajakΣjk)

Jika kita membandingkan fungsi karakteristik ini dengan fungsi karakteristik kita melihat bahwa keduanya sama, tetapi dengan μ Y digantikan oleh μ Z = d j = 1 a j μ j dan dengan σ 2 Y digantikan oleh σ 2 Z = d j = 1d k = 1 a j a k Σ j kφY(t)μYμZ=j=1dajμjσY2σZ2=j=1dk=1dajakΣjk. Oleh karena itu karena fungsi karakteristik setara dengan fungsi karakteristik Y , distribusi juga harus sama. Karenanya Z terdistribusi secara normal. Kita dapat menyederhanakan ekspresi untuk varian dengan mencatat bahwa Σ j k = Σ k j dan kita mendapatkan:ZYZΣjk=Σkj

σZ2=j=1daj2Σjj+2j=2dk=1j1ajakΣjk

Σjj=var(Xj)Σjk=cov(Xj,Xk)d=2a1=a2=1

σZ2=j=12(1)2Σjj+2j=22k=1j1(1)(1)Σjk=Σ11+Σ22+2Σ21
probabilityislogic
sumber
2
+1 Terima kasih telah meluangkan waktu untuk menuliskan detailnya. Bisakah pertanyaan ini dijadikan bagian dari FAQ?
Dilip Sarwate