Untuk menghitung prediksi rata-rata model pada skala respons GLM, yang "benar" dan mengapa?
- Hitung model rata-rata prediksi pada skala tautan dan kemudian kembali transformasi ke skala respons, atau
- Kembali mengubah prediksi ke skala respons dan kemudian menghitung rata-rata model
Prediksinya dekat tetapi tidak sama jika modelnya adalah GLM. Paket R yang berbeda memberikan opsi untuk keduanya (dengan standar yang berbeda). Beberapa kolega berpendapat dengan keras bahwa # 1 salah karena "semua orang melakukan # 2". Intuisi saya mengatakan bahwa # 1 adalah "benar" karena membuat semua linear matematika linear (# 2 rata-rata hal-hal yang tidak pada skala linier). Simulasi sederhana menemukan bahwa # 2 memiliki MSE yang sangat (sangat!) Sedikit lebih kecil dari # 1. Jika # 2 benar, apa alasannya? Dan, jika # 2 benar, mengapa alasan saya (menjaga linear matematika linear) alasan yang buruk?
Sunting 1: Komputasi berarti marginal atas tingkat faktor lain dalam GLM adalah masalah yang mirip dengan pertanyaan yang saya ajukan di atas. Russell Lenth menghitung alat marginal model GLM menggunakan "waktu" (kata-katanya) # 1 (dalam paket emmeans) dan argumennya mirip dengan intuisi saya.
Sunting 2: Saya menggunakan rata-rata model untuk merujuk ke alternatif untuk pemilihan model di mana prediksi (atau koefisien) diperkirakan sebagai rata-rata tertimbang untuk semua atau sebagian dari model bersarang "terbaik" (lihat referensi dan paket R di bawah) .
Mengingat model bersarang, di mana adalah prediksi linear (dalam ruang link) untuk individu untuk model , dan adalah berat untuk model , model-rata prediksi menggunakan # 1 di atas (rata-rata pada link skala dan kemudian backtransformasi ke skala respons) adalah:η m i i m w m m
dan prediksi model-rata-rata menggunakan # 2 di atas (kembali mengubah semua prediksi dan kemudian rata-rata pada skala respons) adalah:
Beberapa metode Bayesian dan Frequentist dari model rata-rata adalah:
Hoeting, JA, Madigan, D., Raftery, AE dan Volinsky, CT, 1999. Model Bayesian rata-rata: tutorial. Ilmu statistik, hal.382-401.
Burnham, KP dan Anderson, DR, 2003. Pemilihan model dan inferensi multimodel: pendekatan informasi-teori praktis. Sains Springer & Media Bisnis.
Hansen, BE, 2007. Model kuadrat terkecil rata-rata. Econometrica, 75 (4), hal.1175-1189.
Claeskens, G. dan Hjort, NL, 2008. Pemilihan model dan rata-rata model. Cambridge Books.
Paket R termasuk BMA , MuMIn , BAS , dan AICcmodavg . (Catatan: ini bukan pertanyaan tentang kebijaksanaan rata-rata model).
Jawaban:
Cara optimal untuk menggabungkan estimator atau prediktor tergantung pada fungsi kerugian yang Anda coba untuk meminimalkan (atau fungsi utilitas yang Anda coba untuk memaksimalkan).
Secara umum, jika fungsi kerugian mengukur kesalahan prediksi pada skala respons, maka rata-rata prediktor pada skala respons benar. Jika, misalnya, Anda berupaya meminimalkan kesalahan prediksi kuadrat yang diharapkan pada skala respons, maka prediktor rata-rata posterior akan optimal dan, tergantung pada asumsi model Anda, yang mungkin setara dengan rata-rata prediksi pada skala respons.
Perhatikan bahwa rata-rata pada skala prediktor linier dapat berkinerja sangat buruk untuk model diskrit. Misalkan Anda menggunakan regresi logistik untuk memprediksi probabilitas variabel respons biner. Jika salah satu model memberikan perkiraan probabilitas nol, maka prediktor linier untuk model itu akan minus minus. Mengambil rata-rata tak terhingga dengan sejumlah nilai terbatas masih akan tak terbatas.
Sudahkah Anda berkonsultasi dengan referensi yang Anda daftarkan? Saya yakin bahwa Hoeting et al (1999) misalnya membahas fungsi kerugian, walaupun mungkin tidak terlalu detail.
sumber