Membandingkan model yang tidak bersarang dengan AIC

19

Katakanlah kita harus GLMM

mod1 <- glmer(y ~ x + A + (1|g), data = dat)
mod2 <- glmer(y ~ x + B + (1|g), data = dat)

Model-model ini tidak bersarang dalam arti biasa:

a <- glmer(y ~ x + A + (1|g),     data = dat)
b <- glmer(y ~ x + A + B + (1|g), data = dat)

jadi kita tidak bisa melakukan anova(mod1, mod2)apa yang kita mau anova(a ,b).

Bisakah kita menggunakan AIC untuk mengatakan model mana yang terbaik?

pengguna1322296
sumber

Jawaban:

24

AIC dapat diterapkan dengan model yang tidak bersarang. Sebenarnya, ini adalah salah satu mitos yang paling luas (kesalahpahaman?) Tentang AIC. Lihat:

Satu hal yang harus Anda perhatikan adalah memasukkan semua konstanta normalisasi, karena ini berbeda untuk model yang berbeda (tidak bersarang):

Lihat juga:

Dalam konteks GLMM, pertanyaan yang lebih rumit adalah seberapa andal AIC untuk membandingkan model semacam ini (lihat juga @ BenBolker). Versi lain dari AIC dibahas dan dibandingkan dalam makalah berikut:

Tempat lilin
sumber
2
perhatikan bahwa perbedaan AIC marginal vs kondisional paling penting ketika mencoba membandingkan model yang berbeda dalam set efek acak mereka
Ben Bolker
@Chelier & Ben Bolker terima kasih banyak atas jawaban Anda. Apakah Anda berdua memiliki referensi yang lebih formal untuk argumen untuk menggunakan AIC dengan cara ini?
user1322296
2
@ user1322296 Saya sarankan untuk pergi ke root, ini adalah makalah Akaike . AIC diperoleh sebagai penaksir perbedaan antara model Anda dan "model sebenarnya". Jadi, tidak ada sarang yang diasumsikan, hanya beberapa kondisi keteraturan.
Lampu
Jadi apakah valid untuk membandingkan AIC dari lm1 = x ~ A + B C dan lm2 = x ~ D + B C misalnya? Terima kasih
crazjo
Tampaknya ada model non-bersarang yang penggunaan AICnya tidak sesuai. Berikut adalah dua contoh: 1 dan 2 . Bisakah Anda memberikan beberapa kondisi di mana pemilihan model non-bersarang berfungsi?
Carl
10

Untuk referensi, sebuah argumen tandingan: Brian Ripley menyatakan dalam "Memilih di antara kelas-kelas besar model" hal. 6-7

Asumsi penting ... Model tersebut bersarang (catatan kaki: lihat bagian bawah halaman 615 dalam cetakan ulang Akaike (1973)). - AIC banyak digunakan ketika mereka tidak

f(x|kθ

Ripley, BD 2004. “Memilih di antara Kelas Besar Model.” Dalam Metode dan Model dalam Statistik , diedit oleh N. Adams, M. Crowder, D. J Hand, dan D. Stephens, 155–70. London, Inggris: Imperial College Press.

Akaike, H. (1973) Teori informasi dan perpanjangan prinsip kemungkinan maksimum. Dalam Simposium Internasional Kedua tentang Teori Informasi (Eds BN Petrov dan F. Cáski), hlm. 267–281, Budapest. Akademiai Kaidó. Dicetak ulang dalam Terobosan dalam Statistik , eds Kotz, S. & Johnson, NL (1992), volume I, hlm. 599-624. New York: Springer.

Ben Bolker
sumber
3

Tampaknya Akaike berpikir AIC adalah alat yang berguna untuk membandingkan model yang tidak bersarang.

"Satu pengamatan penting tentang AIC adalah bahwa definisi itu didefinisikan tanpa referensi spesifik ke model sebenarnya [f (x | kθ)]. Dengan demikian, untuk sejumlah model parametrik terbatas, kami dapat selalu mempertimbangkan model perluasan yang akan memainkan peran [f (x | kθ)] Ini menunjukkan bahwa AIC dapat bermanfaat, setidaknya pada prinsipnya, untuk perbandingan model yang tidak bersarang, yaitu, situasi di mana uji rasio kemungkinan log konvensional tidak berlaku. "

(Akaike 1985, hal 399)

Akaike, Hirotugu. "Prediksi dan entropi." Makalah yang dipilih dari Hirotugu Akaike. Springer, New York, NY, 1985. 387-410.

JonesBC
sumber