Saya harus mengakui bahwa saya sebelumnya belum pernah mendengar istilah itu di kelas, sarjana, atau pascasarjana saya.
Apa artinya regresi logistik menjadi Bayesian? Saya mencari penjelasan dengan transisi dari logistik reguler ke logistik Bayesian seperti berikut ini:
Ini adalah persamaan dalam model regresi linier: .
Ini adalah persamaan dalam model regresi logistik: . Ini dilakukan ketika Anda kategoris.
Apa yang telah kami lakukan adalah mengubah menjadi .ln ( E ( y )
Jadi apa yang dilakukan terhadap model regresi logistik dalam regresi logistik Bayesian? Saya menduga itu tidak ada hubungannya dengan persamaan.
Pratinjau buku ini sepertinya didefinisikan, tetapi saya tidak begitu mengerti. Apa semua ini, kemungkinan hal sebelumnya? Apa itu ? Bolehkah seseorang menjelaskan bagian buku atau model logit Bayesian dengan cara lain?
Catatan: Ini sudah ditanyakan sebelumnya tetapi saya tidak menjawab dengan baik.
Jawaban:
Regresi logistik dapat digambarkan sebagai kombinasi linear
yang dilewatkan melalui fungsi tautan :g
di mana fungsi tautan adalah fungsi logit
di mana hanya mengambil nilai dalam dan fungsi logit terbalik mengubah kombinasi linear ke rentang ini. Di sinilah regresi logistik klasik berakhir.{ 0 , 1 } ηY { 0 , 1 } η
Namun jika Anda ingat bahwa untuk variabel yang hanya mengambil nilai dalam , daripada dapat dianggap sebagai . Dalam hal ini, output fungsi logit dapat dianggap sebagai probabilitas bersyarat "sukses", yaitu . Distribusi Bernoulli adalah distribusi yang menggambarkan probabilitas mengamati hasil biner, dengan beberapa parameter , sehingga kita dapat menggambarkan sebagai{ 0 , 1 } E ( Y | X , β ) P ( Y = 1 | X ,E( Y) = P( Y= 1 ) { 0 , 1 } E( Y|X,β) P ( Y = 1 | X , β ) p YP( Y= 1 | X, β) P( Y= 1 | X, β) hal Y
Jadi dengan regresi logistik kita mencari beberapa parameter yang togeder dengan variabel bebas membentuk kombinasi linier . Dalam regresi klasik (kami menganggap fungsi tautan sebagai fungsi identitas), namun untuk memodelkan yang mengambil nilai dalam kita perlu mengubah agar sesuai dalam kisaran .X η E ( Y | X , β ) = ηβ X η E( Y| X, β) = η { 0 , 1 } η [ 0 , 1 ]Y { 0 , 1 } η [ 0 , 1 ]
Sekarang, untuk memperkirakan regresi logistik dalam cara Bayesian Anda mengambil beberapa prior untuk parameter seperti halnya regresi linier (lihat Kruschke et al, 2012 ), kemudian gunakan fungsi logit untuk mengubah kombinasi linear , jadi gunakan outputnya sebagai parameter distribusi Bernoulli yang menjelaskan variabel Anda . Jadi, ya, Anda benar-benar menggunakan fungsi persamaan dan logit dengan cara yang sama seperti pada kasus yang sering terjadi, dan sisanya berfungsi (misalnya memilih prior) seperti dengan memperkirakan regresi linier dengan cara Bayesian. η p Yβsaya η hal Y
Pendekatan sederhana untuk memilih prior adalah dengan memilih distribusi Normal (tetapi Anda juga dapat menggunakan distribusi lain, misalnya distribusi - atau Laplace untuk model yang lebih kuat) untuk dengan parameter dan yang telah disetel atau diambil dari prior hierarkis . Sekarang, dengan memiliki definisi model, Anda dapat menggunakan perangkat lunak seperti JAGS untuk melakukan simulasi Markov Chain Monte Carlo agar Anda dapat memperkirakan model. Di bawah ini saya memposting kode JAGS untuk model logistik sederhana (lihat di sini untuk contoh lebih lanjut).β i μ it βsaya μsaya σ2saya
Seperti yang Anda lihat, kode langsung diterjemahkan ke definisi model. Apa yang dilakukan oleh perangkat lunak ini adalah mengambil beberapa nilai dari prior Normal untuk
a
danb
, kemudian menggunakan nilai-nilai tersebut untuk memperkirakanp
dan akhirnya, menggunakan fungsi kemungkinan untuk menilai seberapa besar kemungkinan data Anda diberikan parameter-parameter tersebut (inilah saat Anda menggunakan teorema Bayes, lihat di sini untuk keterangan lebih rinci).Model regresi logistik dasar dapat diperluas untuk memodelkan ketergantungan antara prediktor menggunakan model hierarkis (termasuk hyperpriors ). Dalam hal ini Anda dapat menggambar dari distribusi Normal Multivarian yang memungkinkan kami untuk memasukkan informasi tentang kovarian antara variabel independen Σβsaya Σ
... tapi ini akan menjadi detail, jadi mari kita berhenti di sini.
Bagian "Bayesian" di sini adalah memilih prior, menggunakan teorema Bayes dan mendefinisikan model dalam istilah probabilistik. Lihat di sini untuk definisi "model Bayesian" dan di sini untuk beberapa intuisi umum tentang pendekatan Bayesian . Yang juga bisa Anda perhatikan adalah bahwa mendefinisikan model cukup mudah dan fleksibel dengan pendekatan ini.
Kruschke, JK, Aguinis, H., & Joo, H. (2012). Waktunya telah tiba: metode Bayesian untuk analisis data dalam ilmu organisasi. Metode Penelitian Organisasi, 15 (4), 722-752.
Gelman, A., Jakulin, A., Pittau, GM, dan Su, Y.-S. (2008). Distribusi prior standar yang lemah untuk informasi logistik dan model regresi lainnya. The Annals of Applied Statistics, 2 (4), 1360–1383.
sumber
Itulah yang membuatnya menjadi Bayesian. Model generatif untuk data adalah sama; perbedaannya adalah bahwa analisis Bayesian memilih beberapa distribusi sebelumnya untuk parameter yang menarik, dan menghitung atau mendekati distribusi posterior , yang menjadi dasar semua kesimpulan. Aturan Bayes menghubungkan keduanya: Posterior proporsional dengan kemungkinan kali sebelumnya.
Secara intuitif, ini sebelumnya memungkinkan analis secara matematis untuk mengekspresikan keahlian materi pelajaran atau temuan yang sudah ada sebelumnya. Misalnya, teks yang Anda rujuk mencatat bahwa sebelum adalah normal multivarian. Mungkin penelitian sebelumnya menyarankan kisaran parameter tertentu yang dapat diekspresikan dengan parameter normal tertentu. (Dengan fleksibilitas datang tanggung jawab: Seseorang harus dapat membenarkan mereka sebelum audiensi yang skeptis.) Dalam model yang lebih rumit, seseorang dapat menggunakan keahlian domain untuk menyesuaikan parameter laten tertentu. Sebagai contoh, lihat contoh hati yang dirujuk dalam jawaban ini .β
Beberapa model frequentist dapat dikaitkan dengan mitra Bayesian dengan prior tertentu, meskipun saya tidak yakin yang sesuai dalam kasus ini.
sumber