Regresi Bayesian dengan singular

8

Komunitas SE, saya berharap mendapatkan wawasan tentang masalah berikut. Diberikan model regresi linier sederhana Di bawah fungsi kemungkinan Gaussian dengan istilah kesalahan homoseksual, distribusi bersyarat dari variabel dependen mengambil bentuk Saya menetapkan konjugat bersyarat (tidak informasi) sebelum untuk dan adalah . Ini adalah hasil standar bahwa distribusi posterior marginal dari adalah multivariat t dengan

Y=Xβ+ϵ dimana YRT,XRT×N.
Y|β,hN(Xβ,h-1saya).
βh
β|hN(0,csaya),hG(s-2,v)
c,v0β
β|DtN(β^,Σ^,T).
Apa yang terjadi jika singular? Dalam regresi standar saya akan memilih Moore-Penrose Pseudoinverse daripada menggunakan . Namun, dalam hal ini varian posterior akan singular juga dan saya ragu bahwa distribusi- masih terdefinisi dengan baik. Apakah ini benar?(XX)(XX)+(XX)-1Σ^: =c(XX)-1t

Dan lebih jauh lagi mengganggu saya: Asumsikan saya tidak benar-benar tertarik dengan distribusi posterior dari tetapi hanya kombinasi linear mana , dan . Saya dapat mengambil sampel dari distribusi tersebut meskipun konstruksinya didasarkan pada sesuatu yang tidak benar-benar didefinisikan (distribusi ). Apakah ada cara untuk menangani ini? Atau adakah kesalahan mendasar dalam pertanyaan saya yang membuat seluruh poin saya usang?βz: =SEBUAHβSEBUAHRN-1×N|SEBUAHΣ^SEBUAH|0β

muffin1974
sumber
2
Paling-paling, prior non-informatif memberikan hasil yang bermanfaat ketika data secara unik mengidentifikasi parameter model - Pengamatan ini pada dasarnya mengapa kami memiliki regresi ridge dan kerabatnya alih-alih hanya mengandalkan OLS. Tetapi jika data tidak cukup informatif, biasanya orang akan pergi dengan rute regresi yang diatur (ridge, dll) atau rute Bayes sepenuhnya. Dalam rute Bayes lengkap, tentukan distribusi yang tepat dan informatif sebelum data Anda dan masalahnya akan dapat ditelusuri.
Sycorax berkata Reinstate Monica
1
Terima kasih atas komentar Anda sejauh ini! Saya mendapatkan poin bahwa posterior tidak didefinisikan dengan benar. Namun, apakah ini benar-benar menyebabkan masalah untuk variabel acak yang setidaknya secara teoritis didefinisikan dengan baik? βz
muffin1974
1
Baik. Yang membingungkan saya adalah bahwa posterior tampaknya masuk akal meskipun jalan menuju solusi tidak memuaskan sama sekali. Saat ini saya sedang mencari cara untuk menulis ulang persamaan regresi, karena saya optimis akan mungkin untuk mendapatkan langsung parameter regresi daripada membuang-buang waktu untuk mencari . Namun, meskipun ini tampaknya mungkin dalam kasus spesifik saya, saya masih memiliki pertanyaan apa artinya jika model 'buruk' bersarang dalam model yang berfungsi ...zzβ
muffin1974

Jawaban:

2

Masalah utama dengan pertanyaan Anda adalah bahwa mengambil batasan tidak secara langsung meluas ke pengukuran dan distribusi probabilitas. Ada banyak jenis konvergensi yang terkait dengan tindakan.

Oleh karena itu, mempertimbangkan konjugat

β|hN(0,csaya),hG(s-2,ν)
dan membiarkan ν dan c pergi ke 0 dan , masing-masing, tidak memiliki makna matematika yang tepat atau unik.

Sekarang, jika Anda mempertimbangkan yang tidak patut sebelumnya

π(β,h)1h
tidak ada distribusi posterior yang terkait dengan kemungkinan
L.(β,h|X,y)=exp{-h(y-Xβ)T(y-Xβ)/2}hT/2
karena potensi posterior tidak berintegrasi β tergantung pada h. Tidak ada
Σ^=(XTX)-1
baik karena kebalikannya tidak ada dan tidak ada distribusi yang didefinisikan dengan baik SEBUAHβ.
Xi'an
sumber