Mengapa kita membuat keributan besar tentang menggunakan skor Fisher ketika kita cocok dengan GLM?

16

Saya ingin tahu mengapa kami memperlakukan fitting GLMS seolah-olah mereka adalah beberapa masalah optimasi khusus. Apakah mereka? Bagi saya sepertinya itu hanya kemungkinan maksimum, dan kami menuliskan kemungkinannya dan kemudian ... kami memaksimalkannya! Jadi mengapa kita menggunakan skor Fisher alih-alih segudang skema optimasi yang telah dikembangkan dalam literatur matematika terapan?

Andrew Robinson
sumber

Jawaban:

13

Penilaian Fisher hanyalah versi dari metode Newton yang kebetulan diidentifikasi dengan GLM, tidak ada yang istimewa tentangnya, selain fakta bahwa matriks informasi Fisher kebetulan lebih mudah ditemukan untuk variabel acak dalam keluarga eksponensial. Ini juga terkait dengan banyak materi stat matematika yang cenderung muncul pada waktu yang sama, dan memberikan intuisi geometris yang bagus tentang apa sebenarnya arti informasi Fisher.

Sama sekali tidak ada alasan saya dapat berpikir untuk tidak menggunakan pengoptimal lain jika Anda mau, selain itu Anda mungkin harus kode dengan tangan daripada menggunakan paket yang sudah ada sebelumnya. Saya menduga bahwa penekanan kuat pada skor Fisher adalah kombinasi dari (dalam urutan penurunan berat) pedagogi, kemudahan derivasi, bias sejarah, dan sindrom "tidak-ditemukan-di sini".

Kaya
sumber
1
Saya tidak berpikir ini cukup benar - algoritma IRLS menggunakan Hessian yang diharapkan, sedangkan Newton-Raphson menggunakan Hessian yang diamati - lihat gen.lib.rus.ec/... untuk perbandingan terinci dari 2 algoritma ...
Tom Wenseleers
9

Itu historis, dan pragmatis; GLM rekayasa-balik Nelder dan Wedderburn, sebagai sekumpulan model di mana Anda dapat menemukan MLE menggunakan skoring Fisher (yaitu Kotak Kuadrat Terpulang yang Dibutuhkan Secara Terulang). Algoritma datang sebelum model, setidaknya dalam kasus umum.

Perlu juga diingat bahwa IWLS adalah apa yang mereka miliki di awal 70-an, jadi GLM adalah kelas model yang penting untuk diketahui. Fakta bahwa Anda dapat memaksimalkan kemungkinan GLM secara andal menggunakan algoritma tipe-Newton (biasanya memiliki MLE unik) juga berarti bahwa program seperti GLIM dapat digunakan oleh mereka yang tidak memiliki keterampilan dalam optimasi numerik.

tamu
sumber
Saya tidak berpikir ini cukup benar - algoritma IRLS menggunakan Hessian yang diharapkan, sedangkan Newton-Raphson menggunakan Hessian yang diamati - lihat gen.lib.rus.ec/... untuk perbandingan terinci dari 2 algoritma ...
Tom Wenseleers