Model loges Bayesian - penjelasan intuitif?

11

Saya harus mengakui bahwa saya sebelumnya belum pernah mendengar istilah itu di kelas, sarjana, atau pascasarjana saya.

Apa artinya regresi logistik menjadi Bayesian? Saya mencari penjelasan dengan transisi dari logistik reguler ke logistik Bayesian seperti berikut ini:

Ini adalah persamaan dalam model regresi linier: .E(y)=β0+β1x1+...+βnxn

Ini adalah persamaan dalam model regresi logistik: . Ini dilakukan ketika Anda kategoris.ln(E(y)1E(y))=β0+β1x1+...+βnxn

Apa yang telah kami lakukan adalah mengubah menjadi .ln ( E ( y )E(y)ln(E(y)1E(y))

Jadi apa yang dilakukan terhadap model regresi logistik dalam regresi logistik Bayesian? Saya menduga itu tidak ada hubungannya dengan persamaan.

Pratinjau buku ini sepertinya didefinisikan, tetapi saya tidak begitu mengerti. Apa semua ini, kemungkinan hal sebelumnya? Apa itu ? Bolehkah seseorang menjelaskan bagian buku atau model logit Bayesian dengan cara lain?α

Catatan: Ini sudah ditanyakan sebelumnya tetapi saya tidak menjawab dengan baik.

BCLC
sumber
1
Saya tidak ingin memasukkan ini ke dalam jawaban karena saya pikir @Tim telah membahas sebagian besar. Satu-satunya hal yang hilang dari jawaban sebaliknya adalah bahwa, dalam regresi logistik Bayesian dan model linear umum Bayesian (GLMs) secara umum, distribusi sebelumnya tidak hanya ditempatkan di atas koefisien, tetapi juga pada varian dan kovarian koefisien-koefisien tersebut. Hal ini sangat penting untuk disebutkan karena salah satu keuntungan utama dari pendekatan Bayesian terhadap GLM adalah kemudahan penelusuran yang lebih besar dan dalam banyak kasus juga cocok dengan model kompleks untuk kovarians koefisien.
Brash Equilibrium
2
@ BrashEquilibrium: Anda menyebutkan kemungkinan ekstensi hierarkis dari pemodelan Bayesian standar untuk model logit. Dalam buku kami , kami menggunakan misalnya sebuah g-sebelumnya pada 's, sebelum yang tetap kovarians matriks berasal dari kovariat . XβX
Xi'an
1
Cukup adil pada g sebelumnya.
Brash Equilibrium
1
Yang mengatakan, masih ada prioritas pada kovarian !!!!!! Jika Anda tidak membahasnya, Anda tidak menjelaskan cara kerja regresi logistik sepenuhnya.
Brash Equilibrium

Jawaban:

19

Regresi logistik dapat digambarkan sebagai kombinasi linear

η=β0+β1X1+...+βkXk

yang dilewatkan melalui fungsi tautan :g

g(E(Y))=η

di mana fungsi tautan adalah fungsi logit

E(Y|X,β)=p=logit1(η)

di mana hanya mengambil nilai dalam dan fungsi logit terbalik mengubah kombinasi linear ke rentang ini. Di sinilah regresi logistik klasik berakhir.{ 0 , 1 } ηY{0,1}η

Namun jika Anda ingat bahwa untuk variabel yang hanya mengambil nilai dalam , daripada dapat dianggap sebagai . Dalam hal ini, output fungsi logit dapat dianggap sebagai probabilitas bersyarat "sukses", yaitu . Distribusi Bernoulli adalah distribusi yang menggambarkan probabilitas mengamati hasil biner, dengan beberapa parameter , sehingga kita dapat menggambarkan sebagai{ 0 , 1 } E ( Y | X , β ) P ( Y = 1 | X ,E(Y)=P(Y=1){0,1}E(Y|X,β)P ( Y = 1 | X , β ) p YP(Y=1|X,β)P(Y=1|X,β)pY

yiBernoulli(p)

Jadi dengan regresi logistik kita mencari beberapa parameter yang togeder dengan variabel bebas membentuk kombinasi linier . Dalam regresi klasik (kami menganggap fungsi tautan sebagai fungsi identitas), namun untuk memodelkan yang mengambil nilai dalam kita perlu mengubah agar sesuai dalam kisaran .X η E ( Y | X , β ) = ηβXηE(Y|X,β)=η{ 0 , 1 } η [ 0 , 1 ]Y{0,1}η[0,1]

Sekarang, untuk memperkirakan regresi logistik dalam cara Bayesian Anda mengambil beberapa prior untuk parameter seperti halnya regresi linier (lihat Kruschke et al, 2012 ), kemudian gunakan fungsi logit untuk mengubah kombinasi linear , jadi gunakan outputnya sebagai parameter distribusi Bernoulli yang menjelaskan variabel Anda . Jadi, ya, Anda benar-benar menggunakan fungsi persamaan dan logit dengan cara yang sama seperti pada kasus yang sering terjadi, dan sisanya berfungsi (misalnya memilih prior) seperti dengan memperkirakan regresi linier dengan cara Bayesian. η p YβiηpY

Pendekatan sederhana untuk memilih prior adalah dengan memilih distribusi Normal (tetapi Anda juga dapat menggunakan distribusi lain, misalnya distribusi - atau Laplace untuk model yang lebih kuat) untuk dengan parameter dan yang telah disetel atau diambil dari prior hierarkis . Sekarang, dengan memiliki definisi model, Anda dapat menggunakan perangkat lunak seperti JAGS untuk melakukan simulasi Markov Chain Monte Carlo agar Anda dapat memperkirakan model. Di bawah ini saya memposting kode JAGS untuk model logistik sederhana (lihat di sini untuk contoh lebih lanjut).β i μ itβiμiσi2

model {
   # setting up priors
   a ~ dnorm(0, .0001)
   b ~ dnorm(0, .0001)

   for (i in 1:N) {
      # passing the linear combination through logit function
      logit(p[i]) <- a + b * x[i]

      # likelihood function
      y[i] ~ dbern(p[i])
   }
}

Seperti yang Anda lihat, kode langsung diterjemahkan ke definisi model. Apa yang dilakukan oleh perangkat lunak ini adalah mengambil beberapa nilai dari prior Normal untuk adan b, kemudian menggunakan nilai-nilai tersebut untuk memperkirakan pdan akhirnya, menggunakan fungsi kemungkinan untuk menilai seberapa besar kemungkinan data Anda diberikan parameter-parameter tersebut (inilah saat Anda menggunakan teorema Bayes, lihat di sini untuk keterangan lebih rinci).

Model regresi logistik dasar dapat diperluas untuk memodelkan ketergantungan antara prediktor menggunakan model hierarkis (termasuk hyperpriors ). Dalam hal ini Anda dapat menggambar dari distribusi Normal Multivarian yang memungkinkan kami untuk memasukkan informasi tentang kovarian antara variabel independen ΣβiΣ

(β0β1βk)MVN([μ0μ1μk],[σ02σ0,1σ0,kσ1,0σ12σ1,kσk,0σk,1σk2])

... tapi ini akan menjadi detail, jadi mari kita berhenti di sini.

Bagian "Bayesian" di sini adalah memilih prior, menggunakan teorema Bayes dan mendefinisikan model dalam istilah probabilistik. Lihat di sini untuk definisi "model Bayesian" dan di sini untuk beberapa intuisi umum tentang pendekatan Bayesian . Yang juga bisa Anda perhatikan adalah bahwa mendefinisikan model cukup mudah dan fleksibel dengan pendekatan ini.


Kruschke, JK, Aguinis, H., & Joo, H. (2012). Waktunya telah tiba: metode Bayesian untuk analisis data dalam ilmu organisasi. Metode Penelitian Organisasi, 15 (4), 722-752.

Gelman, A., Jakulin, A., Pittau, GM, dan Su, Y.-S. (2008). Distribusi prior standar yang lemah untuk informasi logistik dan model regresi lainnya. The Annals of Applied Statistics, 2 (4), 1360–1383.

Tim
sumber
1
Anda perlu bukti untuk varians, tidak hanya koefisien.
Brash Equilibrium
3
@BCLC no, untuk regresi logistik logit digunakan sebagai fungsi tautan , sedangkan adalah kombinasi linier , misalnya untuk regresi linier adalah fungsi identitas sehingga , ini hanyalah spesifikasi standar GLM . η η = β 0 + β 1 X 1 g E ( Y ) = ηgηη=β0+β1X1gE(Y)=η
Tim
1
@BCLC memeriksa tautan dalam jawaban saya, mereka memberikan pengantar statistik Bayesian secara umum. Ini adalah topik yang jauh lebih luas daripada yang disebutkan dalam pertanyaan awal Anda, tetapi Anda dapat menemukan pengantar yang bagus dalam referensi yang saya berikan dalam jawaban saya.
Tim
1
@Tim saya membuat kesalahan ketik di sana. Bukti seharusnya membaca prior. Pada dasarnya, koefisien bukan satu-satunya parameter yang tidak diketahui. Distribusi multinomial juga memiliki matriks varians kovarians dan biasanya kami tidak menganggapnya dikenal.
Brash Equilibrium
3
"Bagian" Bayesian "di sini adalah memilih prior, menggunakan teorema Bayes dan mendefinisikan model dalam istilah probabilistik." Referensi yang baik di sini adalah Gelman et al. DISTRIBUSI SEBELUMNYA INFORMATIF UNTUK DISTRIBUSI LOGISTIK DAN MODEL REGRESI LAINNYA stat.columbia.edu/~gelman/research/published/priors11.pdf
Dalton Hance
6

Apa semua ini, kemungkinan hal sebelumnya?

Itulah yang membuatnya menjadi Bayesian. Model generatif untuk data adalah sama; perbedaannya adalah bahwa analisis Bayesian memilih beberapa distribusi sebelumnya untuk parameter yang menarik, dan menghitung atau mendekati distribusi posterior , yang menjadi dasar semua kesimpulan. Aturan Bayes menghubungkan keduanya: Posterior proporsional dengan kemungkinan kali sebelumnya.

Secara intuitif, ini sebelumnya memungkinkan analis secara matematis untuk mengekspresikan keahlian materi pelajaran atau temuan yang sudah ada sebelumnya. Misalnya, teks yang Anda rujuk mencatat bahwa sebelum adalah normal multivarian. Mungkin penelitian sebelumnya menyarankan kisaran parameter tertentu yang dapat diekspresikan dengan parameter normal tertentu. (Dengan fleksibilitas datang tanggung jawab: Seseorang harus dapat membenarkan mereka sebelum audiensi yang skeptis.) Dalam model yang lebih rumit, seseorang dapat menggunakan keahlian domain untuk menyesuaikan parameter laten tertentu. Sebagai contoh, lihat contoh hati yang dirujuk dalam jawaban ini .β

Beberapa model frequentist dapat dikaitkan dengan mitra Bayesian dengan prior tertentu, meskipun saya tidak yakin yang sesuai dalam kasus ini.

Sean Easter
sumber
SeanEaster, 'prior' adalah kata yang digunakan untuk asumsi distribusi? Misalnya kita menganggap X's atau (jika Anda maksudkan seperti dalam , apakah yang Anda maksudkan adalah , , ..., ? Saya tidak pikir memiliki distribusi ...?) normal tetapi kemudian kami mencoba memasukkannya ke distribusi lain? Apa sebenarnya yang Anda maksud dengan 'aproksimasi'? Saya merasa itu tidak sama dengan 'cocok'β β 1 , βββX 1 X 2 X n ββ1,β2,...,βnX1X2Xnβ
BCLC
1
@BCLC Untuk menjawabnya, saya akan mulai dengan proses inferensi Bayesian dan mendefinisikan istilah-istilah yang saya gunakan: Bayesian memperlakukan semua parameter yang diminati sebagai variabel acak dan memperbarui keyakinan mereka tentang parameter ini berdasarkan data. The distribusi sebelum mengungkapkan keyakinan mereka tentang parameter sebelum menganalisis data; * distribusi posterior * —dengan aturan Bayes, produk yang dinormalisasi sebelum dan kemungkinan — merangkum keyakinan yang tidak pasti tentang parameter-parameter sehubungan dengan prior dan data. Menghitung posterior adalah tempat pemasangan dilakukan.
Sean Easter
1
@BCLC Jadi mengapa parameter memiliki distribusi. Dalam model Bayesian lain — umumnya sederhana —, distribusi posterior mungkin memiliki ekspresi bentuk tertutup. (Dalam variabel acak Bernoulli dengan beta sebelum , posterior adalah distribusi beta, misalnya.) Tetapi ketika posterior tidak dapat diekspresikan secara analitik, kami memperkirakannya , umumnya menggunakan metode MCMC. p pβhalhal
Sean Easter
Oke saya pikir saya mengerti Anda lebih baik setelah membaca An Essay menuju memecahkan Masalah dalam Ajaran Peluang . Terima kasih SeanEster
BCLC
1
P(B)