Bayes regression: bagaimana cara dilakukan dibandingkan dengan regresi standar?

57

Saya mendapat beberapa pertanyaan tentang regresi Bayesian:

  1. Diberikan regresi standar sebagai . Jika saya ingin mengubahnya menjadi regresi Bayesian, apakah saya perlu distribusi sebelumnya baik untuk β 0 dan β 1 (atau tidakkah cara ini berhasil)?y=β0+β1x+εβ0β1

  2. Dalam regresi standar seseorang akan mencoba untuk meminimalkan residu untuk mendapatkan nilai tunggal untuk dan β 1 . Bagaimana ini dilakukan dalam regresi Bayes?β0β1


Saya sangat berjuang di sini:

posterior=prior×likelihood

Kemungkinan berasal dari dataset saat ini (jadi ini adalah parameter regresi saya tetapi bukan sebagai nilai tunggal tetapi sebagai distribusi kemungkinan, kan?). Sebelumnya berasal dari penelitian sebelumnya (katakanlah). Jadi saya mendapatkan persamaan ini:

y=β1x+ε

dengan kemungkinan atau posterior saya (atau apakah ini hanya salah total)? β1

Saya benar-benar tidak dapat memahami bagaimana regresi standar berubah menjadi Bayes.

TinglTanglBob
sumber

Jawaban:

93

Model regresi linier sederhana

yi=α+βxi+ε

dapat ditulis dalam bentuk model probabilistik di belakangnya

μi=α+βxiyiN(μi,σ)

yaitu variabel dependen mengikuti distribusi normal yang diparameterisasi dengan rata-rata μ i , yaitu fungsi linier X yang diparameterisasi oleh α , β , dan dengan standar deviasi σ . Jika Anda memperkirakan model seperti itu menggunakan kuadrat terkecil biasa , Anda tidak perlu repot dengan formulasi probabilistik, karena Anda mencari nilai optimal parameter α , β dengan meminimalkan kesalahan kuadrat dari nilai yang dipasang ke nilai yang diprediksi. Di sisi lain, Anda bisa memperkirakan model seperti itu menggunakan estimasi kemungkinan maksimumYμiXα,βσα,β, di mana Anda akan mencari nilai parameter optimal dengan memaksimalkan fungsi kemungkinan

argmaxα,β,σi=1nN(yi;α+βxi,σ)

di mana adalah fungsi densitas distribusi normal dievaluasi pada y i poin, parametrized dengan cara α + β x i dan standar deviasi σ .Nyiα+βxiσ

Dalam pendekatan Bayesian alih-alih memaksimalkan fungsi kemungkinan saja, kita akan mengasumsikan distribusi sebelumnya untuk parameter dan menggunakan teorema Bayes

posteriorlikelihood×prior

α,β,σ

f(α,β,σY,X)posteriori=1nN(yiα+βxi,σ)likelihoodfα(α)fβ(β)fσ(σ)priors

α,βtσ

Formulasi model regresi linier Bayesian

(sumber: http://www.indiana.edu/~kruschke/BMLR/ )

Sementara di kemungkinan maksimum Anda sedang mencari nilai optimal tunggal untuk masing-masing parameter, dalam pendekatan Bayesian dengan menerapkan teorema Bayes Anda mendapatkan posterior distribusi parameter. Estimasi akhir akan tergantung pada informasi yang berasal dari data Anda dan dari prior Anda , tetapi semakin banyak informasi terkandung dalam data Anda, semakin sedikit berpengaruh adalah prior .

f(θ)1

Untuk memperkirakan model dalam pendekatan Bayesian dalam beberapa kasus, Anda dapat menggunakan prior konjugat , sehingga distribusi posterior tersedia secara langsung (lihat contoh di sini ). Namun dalam sebagian besar kasus distribusi posterior tidak akan tersedia secara langsung dan Anda harus menggunakan metode Markov Chain Monte Carlo untuk memperkirakan model (lihat contoh ini menggunakan algoritma Metropolis-Hastings untuk memperkirakan parameter regresi linier). Akhirnya, jika Anda hanya tertarik pada estimasi titik parameter, Anda bisa menggunakan estimasi posteriori maksimum , yaitu

argmaxα,β,σf(α,β,σY,X)

Untuk deskripsi yang lebih rinci tentang regresi logistik Anda dapat memeriksa model logit Bayesian - penjelasan intuitif? benang.

Untuk mempelajari lebih lanjut, Anda dapat memeriksa buku-buku berikut:

Kruschke, J. (2014). Melakukan Analisis Data Bayesian: Tutorial dengan R, JAGS, dan Stan. Pers Akademik.

Gelman, A., Carlin, JB, Stern, HS, dan Rubin, DB (2004). Analisis data Bayesian. Chapman & Hall / CRC.

Tim
sumber
2
βiβi
2
+1. Satu hal lagi yang mungkin berguna untuk menjelaskan hubungan antara pendekatan Bayesian dan OLS adalah bahwa OLS dapat dipahami sebagai rata-rata posterior di bawah flat sebelumnya (setidaknya sejauh yang saya mengerti). Akan lebih bagus jika Anda bisa menguraikan sedikit dalam jawaban Anda.
Amoeba berkata Reinstate Monica
@amoeba itu poin yang bagus, saya akan memikirkannya. Tetapi di sisi lain, saya tidak ingin membuat jawaban terlalu lama, jadi ada gunanya pergi ke detail.
Tim
1
@amoeba FYI, saya menambahkan komentar singkat tentang itu.
Tim
22

D=(x1,y1),,(xN,yN)xRd,yR

wN(0,σw2Id)

w(w1,,wd)TIdd×d

YiN(wTxi,σ2)

YiYj|w,ij

a=1/σ2b=1/σw2a,b

p(w)exp{b2wtw}

p(D|w)exp{a2(yAw)T(yAw)}

y=(y1,,yN)TAn×dxiT

p(w|D)p(D|w)p(w)

Setelah banyak perhitungan kami menemukan itu

p(w|D)N(w|μ,Λ1)

Λ

Λ=aATA+bId
μ=aΛ1ATy

μwMAP

μΛ=aATA+bId

μ=(ATA+baId)1ATy

wMLE

wMLE=(ATA)1ATy

μλ=ba

Untuk distribusi posterior prediktif:

p(y|x,D)=p(y|x,D,w)p(w|x,D)dw=p(y|x,w)p(w|D)dw

adalah mungkin untuk menghitungnya

y|x,DN(μTx,1a+xTΛ1x)

Referensi: Lunn et al. Buku BUGS

Untuk menggunakan alat MCMC seperti JAGS / Stan, periksa Analisis Data Doing Bayesian dari Kruschke

jpneto
sumber
Terima kasih jpneto. Saya merasa ini adalah jawaban yang bagus, tetapi saya belum memahaminya karena kurangnya pengetahuan matematika. Tapi saya pasti akan membacanya lagi setelah mendapatkan beberapa keterampilan matematika
TinglTanglBob
1
Ini sangat bagus, tetapi asumsi bahwa ketepatannya diketahui agak tidak biasa. Bukankah jauh lebih umum untuk mengasumsikan distribusi Gamma terbalik untuk varians, yaitu distribusi Gamma untuk presisi?
DeltaIV
w
wN(0,λ1Id)λ
1
@DeltaIV: pasti, ketika kita memiliki ketidakpastian tentang suatu parameter kita dapat memodelkannya dengan yang sebelumnya. Asumsi presisi yang diketahui adalah untuk membuatnya lebih mudah untuk menemukan solusi analitik. Biasanya, solusi analitik itu tidak mungkin dan kita harus menggunakan perkiraan, seperti MCMC atau teknik variasional.
jpneto