Winbugs dan MCMC lainnya tanpa informasi untuk distribusi sebelumnya

10

Apa yang terjadi ketika Anda tidak memiliki gagasan tentang distribusi parameter? Pendekatan apa yang harus kita gunakan?

Sebagian besar waktu kami bertujuan untuk menggarisbawahi jika variabel tertentu memiliki pengaruh terhadap ada / tidaknya spesies tertentu, dan variabel tersebut diterima atau tidak sesuai dengan variabel pentingnya. Ini berarti bahwa sebagian besar waktu kita tidak memikirkan distribusi yang diharapkan dari sebuah parameter.

Apakah benar untuk mengasumsikan bahwa semua parameter mengikuti distribusi normal, ketika semua yang saya tahu adalah bahwa b1, b2, b3 dan b4 harus bervariasi antara -2 dan 2, dan b0 dapat bervariasi antara -5 dan 5?

model {
    # N observations
    for (i in 1:N) {
        species[i] ~ dbern(p[i])
        logit(p[i]) <- b0 + b1*var1[i] + b2*var2[i] + 
            b3*var3[i] + b4*var4[i]
    }
    # Priors
    b0     ~ dnorm(0,10)
    b1   ~ dnorm(0,10)
    b2 ~ dnorm(0,10)
    b3  ~ dnorm(0,10)
    b4  ~ dnorm(0,10)
}
Gago-Silva
sumber
Jika Anda tidak memiliki prior, Anda tidak dapat menggunakan inferensi Bayesian. Dan karenanya metodologi MCMC,
Xi'an

Jawaban:

6

Parameter dalam prediktor linier adalah t-didistribusikan . Ketika jumlah catatan pergi hingga tak terbatas, itu menyatu dengan distribusi normal. Jadi ya, biasanya dianggap benar untuk mengasumsikan distribusi parameter yang normal.

Bagaimanapun, dalam statistik bayesian, Anda tidak perlu mengasumsikan distribusi parameter. Biasanya Anda menentukan apa yang disebut prior uninformative . Untuk masing-masing kasus, berbagai prior uninformative direkomendasikan. Dalam hal ini, orang sering menggunakan sesuatu seperti (Anda dapat mengubah nilai tentu saja):

dunif(-100000, 100000)

atau

dnorm(0, 1/10^10)

Yang kedua lebih disukai, karena tidak terbatas pada nilai-nilai tertentu. Dengan prior yang tidak informatif, Anda tidak mengambil risiko. Tentu saja Anda dapat membatasi mereka pada interval tertentu, tetapi berhati-hatilah.

Jadi, Anda tentukan sebelumnya tidak informatif dan distribusi parameter akan keluar sendiri! Tidak perlu membuat asumsi tentang hal itu.

Ingin tahu
sumber
1
Sayangnya, ini tidak sepenuhnya benar: batas-batas dalam seragam sebelumnya dapat mempengaruhi hasilnya, esp. saat menguji hipotesis. Ini adalah kelemahan Winbugs menurut saya.
Xi'an
@ Xi'an - tentu saja, itu yang saya katakan. Itu sebabnya saya lebih suka "flat normal" dalam kasus ini - yaitu opsi kedua. Mungkin dengan mengutak-atik parameter kedua.
Penasaran
1
Hmmm, ini sama sekali bukan flat ...
Xi'an
Anda bebas menggunakan dnorm(0, 1/10^10)atau apa pun
Curious
8

Sayangnya, prior tampaknya tidak berbahaya bisa sangat berbahaya (dan bahkan menipu beberapa Bayesians berpengalaman).

Makalah baru-baru ini, memberikan pengantar yang bagus bersama dengan metode merencanakan untuk memvisualisasikan sebelumnya dan posterior (biasanya marginal / posterior untuk parameter yang menarik).

Bahaya Tersembunyi Menentukan Prior Noninformatif. John W. Seaman III, John W. Seaman Jr & James D. Stamey The American StatisticianVolume 66, Edisi 2, Mei 2012, halaman 77-84. http://amstat.tandfonline.com/doi/full/10.1080/00031305.2012.695938

Plot seperti itu menurut saya harus menjadi kewajiban dalam analisis Bayesian yang sebenarnya, bahkan jika analis tidak membutuhkannya - apa yang terjadi dalam analisis Bayesian harus diperjelas bagi sebagian besar pembaca.

phaneron
sumber
2
tautan yang bagus, sangat disayangkan tidak tersedia secara gratis.
Penasaran
6

Analisis sensitivitas biasanya merupakan cara yang baik untuk: coba berbagai prior dan lihat bagaimana hasil Anda berubah dengannya. Jika mereka kuat, Anda mungkin dapat meyakinkan banyak orang tentang hasil Anda. Jika tidak, Anda mungkin ingin entah bagaimana mengukur bagaimana prior mengubah hasil.

kegilaan
sumber