Premisnya adalah kutipan ini dari sketsa paket R betareg
1 .
Lebih jauh lagi, model ini berbagi beberapa sifat (seperti prediktor linier, fungsi tautan, parameter dispersi) dengan model linier umum (GLMs; McCullagh dan Nelder 1989), tetapi ini bukan kasus khusus dari kerangka kerja ini (bahkan untuk dispersi tetap )
Jawaban ini juga menyinggung fakta:
[...] Ini adalah jenis model regresi yang sesuai ketika variabel respon didistribusikan sebagai Beta. Anda dapat menganggapnya sebagai analog dengan model linier umum. Ini persis apa yang Anda cari [...] (penekanan pada saya)
Judul pertanyaan mengatakan semuanya: mengapa Regresi Beta / Dirichlet tidak dianggap sebagai Model Linear Umum (bukan?)
Sejauh yang saya tahu, Generalized Linear Model mendefinisikan model yang dibangun berdasarkan ekspektasi variabel dependennya bergantung pada yang independen.
adalah fungsi tautan yang memetakan ekspektasi, adalah distribusi probabilitas, hasil dan prediktor, adalah parameter linier dan varians.Y X β σ 2
GLM yang berbeda memaksakan (atau mengendurkan) hubungan antara mean dan varians, tetapi harus menjadi distribusi probabilitas dalam keluarga eksponensial, properti yang diinginkan yang akan meningkatkan kekokohan estimasi jika saya ingat dengan benar. Distribusi Beta dan Dirichlet adalah bagian dari keluarga eksponensial, jadi saya kehabisan ide.
[1] Cribari-Neto, F., & Zeileis, A. (2009). Regresi beta dalam R.
Jawaban:
Periksa referensi asli:
seperti yang penulis perhatikan, parameter distribusi beta yang diparameterisasi kembali berkorelasi, jadi
Jadi, sementara model terlihat seperti GLM dan dukun seperti GLM, itu tidak cocok dengan kerangka kerja.
sumber
Jawaban oleh @probabilityislogic ada di jalur yang benar.
Distribusi beta adalah dalam keluarga eksponensial dua parameter . Model GLM sederhana yang dijelaskan oleh Nelder dan Wedderburn (1972) tidak termasuk semua distribusi dalam keluarga eksponensial dua parameter.
Dalam hal artikel oleh N&W, GLM berlaku untuk fungsi kepadatan jenis berikut (ini kemudian dinamai keluarga dispersi eksponensial dalam Jørgensen 1987 ):
dengan fungsi tautan tambahan dan model linier untuk parameter alami θ = f ( μ ) = f ( X β ) .f( ) θ = f( μ ) = f( Xβ)
Jadi kita dapat menulis ulang distribusi di atas juga:
Dua keluarga eksponensial parameter adalah:
yang terlihat mirip tetapi lebih umum (juga jika salah satu dari adalah konstan).θ
Perbedaannya jelas, dan juga menempatkan distribusi beta dalam bentuk sebagai GLM tidak dimungkinkan.
Namun, saya kurang memiliki pemahaman yang cukup untuk membuat jawaban yang lebih intuitif dan terinformasi dengan baik (saya merasa bahwa mungkin ada hubungan yang jauh lebih dalam dan lebih elegan untuk berbagai prinsip dasar). GLM menggeneralisasi distribusi kesalahan dengan menggunakan model dispersi eksponensial variate tunggal sebagai pengganti model kuadrat terkecil dan menggeneralisasikan hubungan linear dalam mean, dengan menggunakan fungsi tautan.
Intuisi terbaik dan paling sederhana tampaknya adalah dispersi- -term dalam eksponensial, yang dikalikan dengan segala sesuatu dan dengan demikian dispersi tidak berbeda dengan θ . Sedangkan beberapa keluarga eksponensial dua parameter, dan metode kuasi-kemungkinan, memungkinkan parameter dispersi menjadi fungsi θ juga.α ( ϕ ) θ θ
sumber
Saya tidak berpikir distribusi beta adalah bagian dari keluarga dispersi eksponensial . Untuk mendapatkan ini, Anda harus memiliki kepadatan
sumber