Saya punya masalah di mana
Saya amati, tetapi bukan atau . Saya ingin memperkirakan
Aku bisa memperkirakan , menggunakan semacam model regresi. Ini memberi saya . Saya kemudian bisa memperkirakan
Masalah pertama: model regresi untuk memprediksi dapat menyebabkan menjadi negatif, yang tidak masuk akal. Tidak yakin bagaimana menyiasati ini (bukan masalah yang sering saya tangani) tapi sepertinya jenis hal yang orang lain tangani secara rutin. Semacam GLM non-gaussian?
Masalah utama adalah bagaimana menjelaskan ketidakpastian dalam model utama yang berasal dari memperkirakan . Saya telah menggunakan beberapa imputasi sebelumnya untuk kovariat yang hilang. Tetapi ini adalah "parameter laten" yang hilang. Atau, itu adalah data hasil, yang tampaknya OK untuk menyalahkan . Namun saya sering mendengar EM digunakan untuk parameter "laten". Saya tidak yakin mengapa, saya juga tidak tahu apakah EM lebih baik dalam konteks ini. MI intuitif untuk memahami, mengimplementasikan, dan berkomunikasi. EM intuitif untuk dipahami, tetapi tampaknya lebih sulit untuk diterapkan (dan saya belum melakukannya).
Apakah EM lebih unggul untuk jenis masalah yang saya dapatkan di atas? Jika demikian, mengapa? Kedua, bagaimana seseorang mengimplementasikannya dalam R untuk model linier, atau untuk model semiparametrik (GAM)?
sumber
Jawaban:
Masuk akal atau tidak menggunakan GLM tergantung pada distribusi . Saya akan cenderung menggunakan model kuadrat terkecil nonlinear untuk semuanya.y
Jadi, jika model regresi Anda adalah mana adalah prediktor dan adalah parameter dalam model regresi untuk , dan model Anda untuk adalah tetapi di mana dibatasi menjadi non-negatif, Anda dapat menulis dan cocok dengan model seperti ini:a=Zα+ν Z α a b b=f(x)+ϵ f(x) f(x)=exp(ψ(x))
di mana adalah jumlah dari dua istilah kebisingan individu. (Jika Anda benar-benar berniat bahwa tanpa kesalahan sama sekali, Anda harus melakukannya secara berbeda; itu bukan masalah statistik sebanyak masalah perkiraan dan Anda mungkin ingin melihat norma-norma tak terhingga).η y=a+b
Jika Anda mengatakan spline regresi kubik untuk itu akan menjadi salah satu cara mudah untuk mendapatkan beberapa fungsi kelancaran umum. Model itu dapat dipasang oleh kuadrat terkecil nonlinear. (Memang, beberapa algoritma bisa mengambil keuntungan dari linearitas dari untuk mempermudah dan mempercepat perhitungan.)ψ a
Bergantung pada apa yang Anda asumsikan tentang atau , ada beberapa hal lain yang mungkin Anda lakukan.y f
Itu belum benar-benar mengatasi masalah imputasi. Namun, kerangka kerja model semacam ini dapat dimasukkan ke dalam sesuatu seperti saran Anda untuk menggunakan EM.
sumber