Formula probabilitas untuk distribusi multivariat-bernoulli

13

Saya memerlukan rumus untuk probabilitas suatu kejadian dalam distribusi Bernoulli n-variate dengan diberi probabilitas untuk elemen tunggal dan untuk pasangan elemen . Secara ekuivalen saya bisa memberi nilai rata-rata dan kovarianX{0,1}nP(Xi=1)=piP(Xi=1Xj=1)=pijX .

Saya sudah belajar bahwa ada banyak {0,1}n distribusi yang memiliki sifat sama seperti ada banyak distribusi yang memiliki nilai tengah dan kovarians. Saya mencari yang kanonik pada {0,1}n , seperti halnya Gaussian adalah distribusi kanonik untuk Rn dan mean dan kovarians yang diberikan.

mpiktas
sumber

Jawaban:

11

Variabel acak yang mengambil nilai dalam adalah variabel acak diskrit. Penyebarannya sepenuhnya dijelaskan oleh probabilitas p i = P ( X = i ) dengan i{ 0 , 1 } n . Probabilitas p i dan p i j yang Anda berikan adalah jumlah p i untuk indeks i tertentu .{0,1}npi=P(X=i)i{0,1}npipijpii

Sekarang sepertinya Anda ingin menggambarkan dengan hanya menggunakan p i dan p i j . Itu tidak mungkin tanpa mengasumsikan properti tertentu pada p i . Untuk melihat bahwa mencoba untuk menurunkan fungsi karakteristik dari X . Jika kita mengambil n = 3 kita dapatkanpipipijpiXn=3

Tidak dimungkinkan mengatur ulang ungkapan ini sehinggap i

Eei(t1X1+t2X2+t3X3)=p000+p100eit1+p010eit2+p001eit3+p110ei(t1+t2)+p101ei(t1+t3)+p011ei(t2+t3)+p111ei(t1+t2+t3)
pimenghilang. Untuk variabel acak gaussian, fungsi karakteristik hanya bergantung pada parameter rata-rata dan kovarian. Fungsi karakteristik mendefinisikan distribusi secara unik, jadi inilah sebabnya Gaussian dapat dideskripsikan secara unik dengan hanya menggunakan mean dan kovarian. Seperti yang kita lihat untuk variabel acak ini bukan masalahnya.X

 

mpiktas
sumber
10

Lihat kertas berikut:

JL Teugels, Beberapa representasi dari Bernoulli multivariat dan distribusi binomial , Journal of Multivariate Analysis , vol. 32, tidak. 2, Februari 1990, 256–268.

Berikut ini abstraknya:

Versi multivariat tetapi vektor untuk Bernoulli dan distribusi binomial dibuat dengan menggunakan konsep produk Kronecker dari kalkulus matriks. Distribusi Bernoulli multivariat memerlukan model parameter, yang menyediakan alternatif untuk model log-linear tradisional untuk variabel biner.

Hamed
sumber
2
Terima kasih telah berbagi itu, Hamed. Selamat datang di situs kami!
Whuber
1

Saya tidak tahu apa sebutan distribusi yang dihasilkan, atau apakah itu bahkan memiliki nama, tetapi menurut saya cara yang jelas untuk mengatur ini adalah dengan memikirkan model yang akan Anda gunakan untuk memodelkan 2 × 2 × 2 × … × 2 tabel menggunakan model log-linear (regresi Poisson). Seperti yang Anda ketahui hanya interaksi tingkat pertama, maka wajar untuk menganggap bahwa semua interaksi tingkat tinggi adalah nol.

P(X1=x1,X2=x2,,Xn=xn)=i[pixi(1pi)1xij<i(pijpipj)xixj]
onestop
sumber
pipi
@whuber Benar benar! Saya tetap menggunakan model yang saya tetapkan pada paragraf pertama, tetapi persamaan saya kacau dalam beberapa cara ... Akan menunjukkan bahwa saya belum benar-benar menggunakan pemodelan log-linear tabel kontingensi sejak MSc saya, dan saya belum punya catatan atau buku di tangan. Saya percaya saya sudah memperbaikinya sekarang. Beri tahu saya jika Anda setuju! Mohon maaf atas keterlambatannya. Beberapa hari otak saya tidak melakukan aljabar.
onestop
1
halsaya=1/nhalsayaj=0sayaj. Ini adalah kombinasi probabilitas yang valid, yang disadari kapansaya adalah variabel acak seragam {1,...,n} dan Xsaya=1 dan semua Xj=0jsaya. Masih rumus di atas akan menjadi 0 untuk semua acara. Masih terima kasih telah membantu!