Masalah dengan membandingkan model GLM yang memiliki fungsi tautan yang berbeda

12

Dengan rangkaian kovariat dan keluarga distribusi yang sama, bagaimana saya bisa membandingkan model yang memiliki fungsi tautan yang berbeda?

Saya pikir jawaban yang benar di sini adalah "AIC / BIC", tetapi saya tidak 100% yakin.

Apakah mungkin untuk memiliki model bersarang jika mereka memiliki tautan yang berbeda?

Davide
sumber
Perhatikan bahwa "AIC / BIC" adalah salah satu jawaban yang mungkin tetapi, pada prinsipnya, teknik pemilihan model (yang sesuai) dapat digunakan.
2
Tidak, mereka tidak bersarang. Juga, ingat bahwa ketika menggunakan AIC / BIC, konstanta normalisasi juga penting .
5
Kriteria informasi, seperti AIC & BIC, cukup sesuaikan penyimpangan model untuk kerumitannya (yaitu, jumlah parameter). Jika Anda memiliki jumlah kovariat yang sama (bahkan tidak harus kovariat yang sama), penyesuaian itu tidak akan relevan. Anda dapat memeriksanya dengan membandingkan penyimpangan secara langsung. Anda mungkin menemukan manfaatnya untuk membaca jawaban saya di sini: perbedaan-antara-logit-dan-probit-model , yang menyentuh masalah ini.
gung - Reinstate Monica
3
Kemungkinan lain untuk membandingkan model, yang sangat umum, tetapi membutuhkan lebih banyak dari Anda, adalah menggunakan metode Parametrik Bootstrap Cross-Fitting. Anda dapat menemukan pdf di sini .
gung - Reinstate Monica
2
Apakah ada keluarga tertentu yang Anda pikirkan dengan 2 fungsi tautan yang memungkinkan? yaitu keluarga binomial, logit vs tautan log?
Placidia

Jawaban:

9

Untuk masalah ini, Anda juga dapat menggunakan apa yang disebut "tes hubungan baik", pengobatan kanonik yang diterbitkan oleh Daryl Pregibon dalam Statistik Terapan pada tahun 1980. Anda mungkin ingin membaca makalah di sini.

Ada juga beberapa pekerjaan yang lebih baru di bagian depan itu, dicatat oleh Cheng dan Wu dalam makalah JASA 1994 mereka .

Seperti yang dinyatakan oleh @gung menggunakan penyimpangan juga dimungkinkan, lihat misalnya, makalah ini jika Anda tidak ingin mengambil nilai nominalnya.

Momo
sumber
3
+1, senang memiliki kertas kanonik. BTW, saya curiga Anda maksudkan pekerjaan terbaru , bukan pekerjaan "alasan".
gung - Reinstate Monica
6

(Saya hanya menyalin informasi dari komentar di sini sehingga pertanyaan ini tidak muncul sebagai tidak dijawab secara resmi.)

Anda dapat membandingkan kedua model dengan membandingkan penyimpangan. Semua yang dilakukan AIC dan BIC adalah menyesuaikan penyimpangan untuk jumlah parameter dalam model. Karena angka itu sama, itu tidak akan membuat perbedaan. Secara umum, akan sangat sulit untuk membedakan antara fungsi tautan yang berbeda kecuali jika bentuknya berbeda; seringkali lebih baik menggunakan pengetahuan teoritis untuk menentukan fungsi tautan yang sesuai. Sebagai contoh, logit dan tautan probit hampir tidak berbeda dalam bentuk sama sekali tetapi berbeda dalam bagaimana Anda berpikir tentang proses menghasilkan data (seperti yang saya bahas di sini ).

gung - Pasang kembali Monica
sumber