Estimator kemungkinan maksimum dari distribusi gabungan yang diberikan hanya jumlah marginal

12

Biarkan menjadi distribusi gabungan dari dua variabel kategori , dengan . Katakanlah sampel diambil dari distribusi ini, tetapi kami hanya diberi jumlah marginal, yaitu untuk : X , Y x , y { 1 , ... , K } n j = 1 , ... , Kpx,yX,Yx,y{1,,K}nj=1,,K

Sj=i=1nδ(Xi=l),Tj=i=1nδ(Yi=j),

Berapakah estimator kemungkinan maksimum untuk , diberikan ? Apakah ini diketahui? Layak secara komputasi? Apakah ada pendekatan masuk akal lain untuk masalah ini selain ML? S j , T jpx,ySj,Tj

RS
sumber
2
Margin tidak benar-benar mengandung informasi * tentang distribusi bersama (memang ini adalah titik kopula). * atau setidaknya hampir tidak ada - jelas margin memang mengandung setidaknya beberapa informasi, karena jumlah interior tidak dapat melebihi margin yang terjadi. Apakah Anda memiliki distribusi gabungan tertentu dalam pikiran? Mengapa Anda menggunakan tag? Apakah Anda mencari solusi entropi maksimum? maximum-entropy
Glen_b -Reinstate Monica
Saya tidak begitu akrab dengan copulas. Apakah mereka tahan untuk kasus kategori juga? Apa artinya itu - bahwa setiap distribusi bersama dengan margin yang sama akan memiliki kemungkinan yang sama? (Saya menandai entropi maksimum karena saya pikir itu relevan.)
RS
Kami bahkan belum memiliki model distribusi yang ditentukan, jadi kami tidak dalam posisi untuk menghitung . Ada banyak kemungkinan di sini. Kopula ada untuk kasus kategorikal terurut (jika tidak unik), tetapi tujuan saya meningkatkannya adalah untuk memberi motivasi mengapa marginal tidak terlalu informatif secara umum. Sehubungan dengan kasus penghitungan kategori, Fisher memperlakukan margin sebagai tidak informatif tentang sambungan, di mana tes pasti Fisher-Irwin. Jika Anda ingin entropi maksimum, Anda mungkin bisa mendapatkan solusi entropi maksimum, tapi saya tidak tahu itu akan sangat informatif tentang ...P(x|θ)
Glen_b -Reinstate Monica
(ctd) ... struktur. Baik dalam kasus ME atau ML, saya pikir Anda pertama-tama akan memerlukan beberapa jenis model, apakah itu bivariat multinomial, hypergeometrik bivariat, atau sesuatu dengan struktur yang lebih banyak. Lihat pertanyaan ini , di mana penulis menempatkan referensi ke dalam jawaban. Itu mungkin bisa membantu.
Glen_b -Reinstate Monica
1
Maksud saya distribusi multinomial bivariat umum. Pertanyaannya berbicara tentang kasus di mana jumlah distribusi diberikan dan kami melihat sampel dari distribusi bersama. Di sini kita memiliki jumlah sampel. Saya pikir masalahnya didefinisikan dengan baik dalam kasus ML (solusinya mungkin tidak unik tapi saya tidak tahu).
RS

Jawaban:

4

Jenis masalah ini dipelajari dalam makalah "Augmentasi Data dalam Tabel Kontingensi Multi-arah Dengan Total Marginal Tetap" oleh Dobra et al (2006). Biarkan menunjukkan parameter model, biarkan menunjukkan tabel bilangan bulat yang tidak teramati untuk setiap pasangan , dan biarkan adalah himpunan tabel bilangan bulat yang marginalnya sama dengan jumlah . Maka probabilitas mengamati jumlah marginal adalah: manan ( x , y ) C ( S , T ) ( S , T ) ( S , T ) p ( S , T | θ ) = nC ( S , T ) p ( n | θ ) p ( n | θ ) n θ θθn(x,y)C(S,T)(S,T)(S,T)

p(S,T|θ)=nC(S,T)p(n|θ)
p(n|θ)adalah distribusi pengambilan sampel multinomial. Ini mendefinisikan fungsi kemungkinan untuk ML, tetapi evaluasi langsung tidak mungkin kecuali untuk masalah kecil. Pendekatan yang mereka rekomendasikan adalah MCMC, di mana Anda secara bergantian memperbarui dan dengan mengambil sampel dari distribusi proposal dan menerima perubahan sesuai dengan rasio penerimaan Metropolis-Hastings. Ini dapat disesuaikan untuk menemukan perkiraan maksimum lebih dari menggunakan Monte Carlo EM. nθθ

Pendekatan yang berbeda akan menggunakan metode variasi untuk memperkirakan jumlah lebih dari . Batasan marginal dapat dikodekan sebagai grafik faktor dan inferensi atas dapat dilakukan dengan menggunakan Propagasi Ekspektasi. θnθ

Untuk melihat mengapa masalah ini sulit dan tidak mengakui solusi sepele, pertimbangkan kasus . Mengambil sebagai jumlah baris dan sebagai jumlah kolom, ada dua tabel jumlah yang memungkinkan: Oleh karena itu fungsi kemungkinan adalah The MLE untuk masalah ini adalah yang sesuai dengan asumsi tabel di sebelah kiri. Sebaliknya, perkiraan yang akan Anda dapatkan dengan mengasumsikan independensi adalah S T [ 0 1 2 0 ]S=(1,2),T=(2,1)ST p(S,T | q)=3 p 12 p 2 21 +6 p 11 p 21 p 22 p x , y = [ 0 1 / 3 2 / 3 0 ] q x , y = [ 1 / 3 2 / 3 ] [ 2 /3

[0120][1011]
p(S,T|θ)=3p12p212+6p11p21p22
p^x,y=[01/32/30]
qx,y=[1/32/3][2/31/3]=[2/91/94/92/9]
yang memiliki nilai kemungkinan lebih kecil.
Tom Minka
sumber
Apakah tidak mungkin mendapatkan solusi analitik?
Ben Kuhn
Terima kasih! Makalah ini tampaknya relevan, meskipun tampaknya dari perspektif Bayesian. Bagaimana dengan kasus spesifik di mana sebenarnya distribusi itu sendiri, yaitu , untuk semua pasangan ? Apakah akan ada solusi analitik dalam kasus ini? θ = { θ x , y } ( x , y )θθ={θx,y}(x,y)
RS
Saya tidak akan curiga ada solusi analitik. Saya menambahkan contoh untuk menggambarkan ini.
Tom Minka
Terima kasih. Mungkin itu benar tanpa gejala? Kemudian, pengkondisian pada total margin sama dengan pengkondisian pada distribusi margin (setelah normalisasi), dan log-kemungkinan untuk setiap tabel integer yang tidak teramati sebanding dengan entropinya. Mungkin sesuatu dengan AEP?
RS
1

Seperti yang telah ditunjukkan oleh @Glen_b, ini tidak cukup ditentukan. Saya tidak berpikir Anda dapat menggunakan kemungkinan maksimum kecuali Anda dapat menentukan kemungkinan sepenuhnya.

Jika Anda bersedia untuk mengambil kemandirian, maka masalahnya cukup sederhana (kebetulan, saya pikir solusinya akan menjadi solusi entropi maksimum yang telah disarankan). Jika Anda tidak mau atau tidak dapat memaksakan struktur tambahan dalam masalah Anda dan Anda masih menginginkan semacam pendekatan terhadap nilai-nilai sel, mungkin Anda bisa menggunakan batas kopula Fréchet-Hoeffding . Tanpa asumsi tambahan, saya tidak berpikir Anda bisa melangkah lebih jauh.

F. Tusell
sumber
Kemungkinan ini bisa multinomial. Mengapa itu tidak cukup?
RS
Seperti yang saya pahami, kemungkinannya adalah fungsi dari parameter yang diberikan data. Di sini, Anda tidak memiliki nilai untuk setiap sel, hanya marginal, maka Anda tidak memiliki fungsi tunggal dari parameter yang dapat Anda hitung, apalagi maksimalkan. Secara umum ada banyak konfigurasi sel yang kompatibel dengan margin, dan masing-masing akan memberikan kemungkinan yang berbeda.
F. Tusell
1
Ya, tapi tidak apa-apa. Parameternya adalah , data adalah marginal. Saya masih bisa menghitung probabilitas marjinal yang diberikan - ini jumlah dari semua probabilitas konfigurasi sel yang memberikan marjinal. Itu satu fungsi yang bisa saya maksimalkan. pp
RS
1

Sunting: Jawaban ini didasarkan pada asumsi yang salah bahwa kemungkinan jumlah marginal yang diberikan hanyalah fungsi dari probabilitas marginal dan . Saya masih memikirkannya.px,ypx=ypx,ypy=xpx,y

Hal-hal yang salah berikut:

Seperti disebutkan dalam komentar, masalah dengan menemukan "the" estimator maksimum-kemungkinan untuk adalah bahwa itu tidak unik. Sebagai contoh, pertimbangkan kasus dengan biner dan marginal . Dua penaksirpx,yX,YS1=S2=T1=T2=10

p=(120012),p=(14141414)

memiliki probabilitas marginal yang sama dan dalam semua kasus, dan karenanya memiliki kemungkinan yang sama (keduanya memaksimalkan fungsi kemungkinan, seperti yang dapat Anda verifikasi).pxpy


Memang, tidak peduli apa marjinalnya (selama dua di antaranya adalah nol di setiap dimensi), solusi kemungkinan maksimum tidak unik. Saya akan membuktikan ini untuk kasus biner. Biarkan menjadi solusi kemungkinan-maksimum. Tanpa kehilangan keumuman misalkan . Kemudian memiliki margin yang sama dan dengan demikian juga merupakan solusi kemungkinan-maksimum.p=(abcd)0<adp=(0b+ac+ada)


Jika Anda ingin tambahan menerapkan batasan entropi maksimum, maka Anda mendapatkan solusi unik, yang seperti F. Tussell menyatakan adalah solusi di mana independen. Anda dapat melihat ini sebagai berikut:X,Y

Entropi dari distribusi adalah ; memaksimalkan subjek ke dan (setara, mana dan ) menggunakan pengganda Lagrange memberikan persamaan:H(p)=x,ypx,ylogpx,yxpx,y=pyypx,y=pxg(p)=0gx(p)=ypx,ypxgy(p)=xpx,ypy

H(p)=kXYλkgk(p)

Semua gradien dari masing-masing adalah 1, jadi koordinasikan dengan bijak inigk

1logpx,y=λx+λypx,y=e1λxλy

ditambah batasan aslinya dan . Anda dapat memverifikasi bahwa ini puas ketika dan , memberikanΣ y p x , y = p x e 1 / 2 - λ x = p x expx,y=pyypx,y=pxe1/2λx=pxe1/2λy=py

px,y=pxpy.
Ben Kuhn
sumber
Untuk contoh pertama: Apa yang diberikan adalah jumlah marginal , bukan probabilitas marginal. Dalam kasus yang telah Anda jelaskan, probabilitas untuk kiri adalah probabilitas yaitu . Untuk kanan , itu adalah , yaitu . Sekalipun tidak ada solusi unik, itu tidak berarti kita tidak bisa menunjuk ke beberapa solusi. Entropi maksimum memberikan solusi unik, tetapi kemungkinan tidak maksimal. p [ [ 10 , 0 ] , [ 0 , 10 ] ] 2 - 20 p 0 a 10 P r [ [ a , 10 - a ] , [ 10 - a , a ] ] 10 4 -S1=S2=T1=T2=10p[[10,0],[0,10]]220p0a10Pr[[a,10a],[10a,a]]10420
RS
Anda telah menghitung probabilitas secara salah; misalnya, Anda lupa menyertakan koefisien binomial. Tetapi Anda benar bahwa kedua matriks memberikan distribusi gabungan yang berbeda dari jumlah marginal meskipun mereka memberikan distribusi marginal yang sama dengan jumlah marginal. (Astaga!) Saya akan memikirkan ini lebih banyak.
Ben Kuhn