Apa distribusi pada kuadran k-dimensi positif dengan matriks kovarians parametrizable?

12

Berikut zzk 's pertanyaan pada masalah dengan simulasi negatif, saya bertanya-tanya apa keluarga parametrized distribusi pada kuadran k-dimensi positif, yang kovarians matriks dapat ditetapkan.R+kΣ

Seperti yang didiskusikan dengan zzk , mulai dari distribusi pada dan menerapkan transformasi linear tidak berfungsi.R+kXΣ1/2(Xμ)+μ

Xi'an
sumber

Jawaban:

6

Misalkan kita memiliki vektor acak normal multivarian dengan dan peringkat penuh matriks definitif simetris positif positif .μ R k k × k Σ = ( σ i j )

(logX1,,logXk)N(μ,Σ),
μRkk×kΣ=(σij)

Untuk lognormal tidak sulit untuk membuktikan bahwa m i : = E [ X i ] = e μ i + σ i i / 2(X1,,Xk)c i j : = Cov [ X i , X j ] = m i

mi:=E[Xi]=eμi+σii/2,i=1,,k,
cij:=Cov[Xi,Xj]=mimj(eσij1),i,j=1,,k,

dan itu mengikuti .cij>mimj

Oleh karena itu, kita dapat mengajukan pertanyaan sebaliknya: diberikan dan matriks definitif positif simetris , memuaskan , jika kita membiarkan kita akan memiliki vektor lognormal dengan cara dan kovarian yang ditentukan. k × k C = ( c i j ) c im=(m1,,mk)R+kk×kC=(cij)μ i =log m i - 1cij>mimjσ i j = log ( c i j

μi=logmi12log(ciimi2+1),i=1,,k,
σij=log(cijmimj+1),i,j=1,,k,

Batasan pada dan sama dengan kondisi alami .m E [ X i X j ] > 0CmE[XiXj]>0

Zen
sumber
Hebat, Paulo! Anda mendapatkan solusi yang berfungsi dan kondisi yang tepat pada matriks kovarian, yang juga menjawab pertanyaan ini . Log-normals terbukti lebih handier daripada gammas, pada akhirnya.
Xi'an
3

Sebenarnya, saya punya solusi untuk pejalan kaki.

  1. Mulai dengan dan pilih dua parameter yang sesuai dengan nilai , .X1Ga(α11,β1)E[X1]var(X1)
  2. Ambil dan pilih tiga parameter yang sesuai dengan nilai , , dan .X2|X1Ga(α21X1+α22,β2)E[X2]var(X2)cov(X1,X2)
  3. Ambil dan pilih empat parameter yang sesuai dengan nilai , , dan .X3|X1,X2Ga(α31X1+α32X2+α33,β3)E[X3]var(X3)cov(X1,X3)cov(X2,X3)

dan seterusnya ... Namun, mengingat kendala pada parameter dan sifat non-linear dari persamaan momen, mungkin beberapa rangkaian momen sesuai dengan tidak ada set parameter yang dapat diterima.

Misalnya, ketika , saya berakhir dengan sistem persamaan k=2

β1=μ1/σ12,α11μ1β1=0

α22=μ2β2α21μ1,α21=(σ12+μ1μ2μ2)σ12+μ12μ1β2
(σ12+μ1μ2μ2)2(σ12+μ12μ1)2σ12+μ2β2=σ22.
Menjalankan kode R dengan nilai arbitrer (dan dapat diterima apriori) untuk dan menyebabkan banyak kasus tanpa solusi. Sekali lagi, ini tidak berarti banyak karena matriks korelasi untuk distribusi pada mungkin memiliki batasan yang lebih kuat yang hanya merupakan penentu positif.μΣR+2

update (04/04): deinst mengulang pertanyaan ini sebagai pertanyaan baru di forum matematika.

Xi'an
sumber
1
Salah satu cara memperluas ini adalah dengan mempertimbangkan keluarga eksponensial alami Kemudian mean dan kovariansi adalah gradien dan Hessian dari . Jika adalah polinomial (dengan eksponen nyata> -1) maka adalah log polinomial (dengan eksponen nyata), dan varians dan Hessian adalah fungsi rasional. Saya pikir ini memberikan kebebasan yang cukup untuk merepresentasikan matriks mean dan kovarian.
f(X|θ)=h(x)eθTXA(θ).
AhA
deinst
@deinst: (+1) Apakah Anda memiliki contoh di mana representasi keluarga eksponensial ini dapat dieksploitasi secara langsung?
Xi'an
2
Mungkin saya tidak mengerti masalahnya. Tetapi, pertimbangkan vektor acak bivariat dengan marginal yang sama dengan dukungan penuh pada dan memiliki rata-rata . Bagaimana seperti distribusi bivariat dapat memiliki korelasi dekat dengan -1, misalnya? Secara heuristik, meskipun saya belum melakukan ini, tampaknya jika , maka kontradiksi mengenai dukungan harus muncul. Tidak? (X,Y)FR+0<μ<ρP(X>2μ)>0
kardinal
1
Tentu saja ada kendala pada matriks kovarians ketika dukungannya , dibahas melalui kondisi momen Stieltjes . Lagi pula, saya tidak melihat mengapa korelasi dekat dengan -1 dikecualikan secara apriori . ΣR+k
Xi'an
2
Benar, ini terkait dengan apa yang saya maksudkan. Mengenai korelasinya, perhatikan contoh saya. Jika dan memiliki marginal yang sama dengan mean dan korelasi tepat -1 dan , berapakah nilai harus untuk semua realisasi ? (+1 pada pertanyaan dan jawaban. Saya suka ini.)XYFμP(X>2μ)>0YX
kardinal
2

OK, ini adalah tanggapan atas komentar Xi'an. Itu terlalu panjang dan harus terlalu banyak untuk menjadi komentar yang nyaman. Peringatan Lektor: Ini hampir pasti bahwa saya telah membuat kesalahan aljabar. Ini sepertinya tidak sefleksibel yang saya kira.

Mari kita membuat keluarga distribusi di dari bentuk Biarkan dan . Biarkan menjadi polinomial dua istilah di mana adalah bilangan real yang lebih besar dari 0 untuk semua . Lalu kita temukan itu R+3

f(x|θ)=h(x)eθTxA(θ)
x=(x,y,z)θ=(θ1,θ2,θ3)
h(x)=cx1e11x2e21x3e31+dx1f11x2f21x3f31
ei,fii
A(θ)=log(cΓ(e1)θ1e1Γ(e2)θ2e2Γ(e3)θ3e3+dΓ(f1)θ1f1Γ(f2)θ2f2Γ(f3)θ3f3).

Sekarang, untuk memudahkan, mari kita mendefinisikan dan

c=cΓ(e1)Γ(e2)Γ(e2)θ1f1θ2f2θ3f3
d=dΓ(f1)Γ(f2)Γ(f2)θ1e1θ2e2θ3e3

Sekarang, karena rata-rata distribusi kami adalah gradien , kami memiliki , , dan . Dan karena kovarians adalah Hessian dari , kami memiliki dan (istilah lain dari matriks kovarians yang diperoleh dengan mengubah subskrip dengan cara yang jelas).AμX=e1c+f1dθ1(c+d)μY=e2c+f2dθ2(c+d) AσμZ=e3c+f3dθ3(c+d)A Cov(X,Y)=(e1-f1)(e2-f2)cd

σX2=(e1c+f1d)(c+d)+(e1f1)2cdθ12(c+d)2
Cov(X,Y)=(e1f1)(e2f2)cdθ1θ2(c+d)

Kelihatannya ini tidak cukup fleksibel untuk mendapatkan matriks kovarian. Saya perlu mencoba istilah lain dalam polinomial (tapi saya curiga itu juga mungkin tidak berfungsi (jelas saya perlu memikirkan ini lebih lanjut)).

Deinst
sumber
Empat parameter untuk lima kendala ...? (θ1,θ2,θ3,c)
Xi'an
@xian Ada 6 eksponen dan juga. f ieifi
deinst
Saya sedikit (?) Bingung: Anda tidak memproses eksponen sebagai parameter dari keluarga eksponensial. Tapi memang Anda bisa mengubah kekuatan itu seperti yang Anda inginkan agar persamaan 9 momen benar.
Xi'an
@ Xi'an Anda benar, saya tidak memprosesnya sebagai parameter dari keluarga eksponensial. Melakukan hal itu akan membuat keluarga tidak lagi menjadi keluarga alami, dan termasuk mereka akan hanya mengacaukan aljabar untuk mengubah persamaan momen (yang cukup kacau untuk memulai dengan).
deinst