Menguji perbedaan AIC dari dua model non-bersarang

12

Inti dari AIC atau kriteria informasi lainnya adalah bahwa lebih sedikit lebih baik. Jadi jika saya memiliki dua model M1: y = a0 + XA + e dan M2: y = b0 + ZB + u, dan jika AIC yang pertama (A1) kurang dari yang kedua (A2), maka M1 memiliki lebih cocok dari sudut pandang teori informasi. Tetapi apakah ada patokan batas untuk perbedaan A1-A2? Berapa jauh sebenarnya lebih sedikit? Dengan kata lain, apakah ada tes untuk (A1-A2) selain hanya sekedar eyeballing?

Sunting: Peter / Dmitrij ... Terima kasih telah merespons. Sebenarnya, ini adalah kasus di mana keahlian substantif saya bertentangan dengan keahlian statistik saya. Pada dasarnya, masalahnya BUKAN memilih antara dua model, tetapi dalam memeriksa apakah dua variabel yang saya tahu sebagian besar setara menambahkan jumlah informasi yang setara (Sebenarnya, satu variabel dalam model pertama dan vektor di yang kedua. Pikirkan tentang kasus sekelompok variabel terhadap indeks mereka.). Seperti Dmitrij tunjukkan, taruhan terbaik tampaknya adalah Tes Cox. Tetapi apakah ada cara untuk benar-benar menguji perbedaan antara isi informasi kedua model?

pengguna3671
sumber
Anda mungkin juga tertarik untuk melihat Wagonmakers et al. (2004). Menilai model mimikri menggunakan bootstrap parametrik. Jurnal Psikologi Matematika, 48 , 28-50. ( pdf ).
gung - Reinstate Monica

Jawaban:

13

Apakah pertanyaan tentang rasa ingin tahu, yaitu Anda tidak puas dengan jawaban saya di sini ? Jika tidak...

Penyelidikan lebih lanjut dari pertanyaan rumit ini menunjukkan bahwa memang ada aturan umum yang digunakan, yang menyatakan dua model tidak dapat dibedakan oleh kriteria jika perbedaannya . Hal yang sama Anda benar-benar akan baca di artikel wikipedia di (perhatikan tautannya dapat diklik!). Hanya untuk mereka yang tidak mengklik tautan:| A I C 1 - A I C 2 | < 2 A I CAIC|AIC1AIC2|<2AIC

A I C A I CAIC memperkirakan dukungan relatif untuk suatu model. Untuk menerapkan ini dalam praktiknya, kita mulai dengan satu set model kandidat, dan kemudian menemukan nilai sesuai model . Selanjutnya, identifikasi nilai minimum . Pemilihan model kemudian dapat dilakukan sebagai berikut.AICAIC

Sebagai aturan praktis, model yang memiliki mereka dalam dari minimum memiliki dukungan substansial dan harus menerima pertimbangan dalam membuat kesimpulan. Model yang memiliki mereka dalam kisaran dari minimum memiliki dukungan yang jauh lebih sedikit, sementara model dengan mereka atas minimum pada dasarnya tidak memiliki dukungan dan mungkin dihilangkan dari pertimbangan lebih lanjut atau setidaknya gagal menjelaskan beberapa variasi struktural substansial dalam data.AICA I C 4 - 7 A I C > 1012AIC47AIC>10

Pendekatan yang lebih umum adalah sebagai berikut ...

Nyatakan nilai dari model kandidat oleh , . Biarkan menunjukkan minimum dari nilai-nilai itu. Maka dapat diartikan sebagai probabilitas relatif bahwa model ke- meminimalkan kehilangan informasi (perkiraan) informasi.A I C 1 A I C 2 , A I C 3 , , A I C R A I C m i n e ( A I C m i n - A I C i ) / 2 iAICAIC1AIC2,AIC3,,AICRAICmine(AICminAICi)/2i

Sebagai contoh, anggaplah ada tiga model dalam set kandidat, dengan nilai , , dan . Kemudian model kedua adalah kali lebih mungkin dari model pertama untuk meminimalkan kehilangan informasi, dan model ketiga adalah kali mungkin sebagai model pertama untuk meminimalkan kehilangan informasi. Dalam hal ini, kita mungkin mengabaikan model ketiga dari pertimbangan lebih lanjut dan mengambil rata-rata tertimbang dari dua model pertama, dengan bobot dan , masing-masing. Kesimpulan statistik kemudian akan didasarkan pada multimodel tertimbang.100 102 110 e ( 100 - 102 ) / 2 = 0,368 e ( 100 - 110 ) / 2 = 0,007 1 0,368AIC100102110e(100102)/2=0.368e(100110)/2=0.00710.368

Penjelasan yang bagus dan saran yang bermanfaat, menurut saya. Hanya saja, jangan takut membaca apa yang bisa diklik!

Selain itu , perhatikan sekali lagi, kurang disukai untuk set data skala besar. Selain Anda mungkin menemukan berguna untuk diterapkan versi bias-dikoreksi dari kriteria (Anda dapat menggunakan ini kode atau menggunakan rumus , di mana adalah jumlah taksiran parameter). Aturan praktisnya akan sama. B I C A I C A I C c A I C c = A I C + 2 p ( p + 1 )AICBICAICAICcR pAICc=AIC+2p(p+1)np1p

Dmitrij Celov
sumber
Hai Dmitrij ... Saya tahu Anda akan menemukan ini. Sebenarnya, respons Anda terhadap pertanyaan awal membuat kereta ini bergulir. Saya pikir ini akan membuat pertanyaan yang berdiri sendiri yang menarik. Masalah yang saya hadapi adalah bahwa uji statistik (termasuk Tes Cox) sering dilakukan sehingga Anda dapat menguji perbedaan antara dua model pada tingkat signifikansi yang telah ditentukan sebelumnya. Tetapi AIC / BIC berdasarkan kemungkinan, dan bagi saya tampaknya jumlahnya tidak dapat dibandingkan secara langsung kecuali, seperti yang Anda tunjukkan, berdasarkan aturan praktis. Karena ukuran IC tergantung pada skala, nilai absolut (2) dapat bermasalah, bukan?
user3671
@ pengguna, Nilai absolut dari tidak bermasalah. Anda dapat mencari saran probabilitas relatif, jadi Anda mungkin akan lebih percaya diri dengan ini daripada beberapa nilai bagus . Dengan efek skala yang Anda maksud ketika kriteria kurang bias dalam sampel kecil dan konsisten dalam besar? Cobalah konsisten dan untuk sampel kecil juga akan menjadi alternatif yang baik. Aturan praktis masih bisa digunakan. 2 B I C A I C c22BICAICc
Dmitrij Celov
1
@DmitrijCelov (+1 beberapa waktu lalu) jawaban yang bagus - terima kasih untuk menempelkan teks, karena Wikipedia tidak lagi memiliki poin yang dibahas dalam dua paragraf pertama. Paragraf yang dihapus dikutip sebagai hal. 446: Burnham, K. P., and Anderson, D.R. (2002). Model Selection and Multimodel Inference: A Practical Information-Theoretic Approach, 2nd ed. Springer-Verlag. ISBN 0-387-95364-7. dan halaman Wiki pra-revisi ada di sini
James Stanley
Saya harus mencatat bahwa saya belum membaca buku Burnham, dan bahwa referensi Wiki lama menyarankan teks seperti dikutip adalah parafrase. FYI, halaman Wiki diedit pada 16:52, 15 April 2011.
James Stanley
Bisakah Anda membantu dengan pertanyaan lanjutan ini? stats.stackexchange.com/questions/349883/…
Tripartio
8

Saya pikir ini mungkin upaya untuk mendapatkan apa yang tidak Anda inginkan.

Pemilihan model bukanlah ilmu. Kecuali dalam keadaan langka, tidak ada satu model sempurna, atau bahkan satu model "benar"; jarang ada satu pun model "terbaik". Diskusi tentang AIC vs AICc vs BIC vs SBC vs apa pun membuat saya agak tidak tertarik. Saya pikir idenya adalah untuk mendapatkan beberapa model BAIK. Anda kemudian memilih di antara mereka berdasarkan pada kombinasi keahlian substantif dan gagasan statistik. Jika Anda tidak memiliki keahlian substantif (jarang terjadi; jauh lebih jarang daripada yang diperkirakan kebanyakan orang) maka pilih AIC terendah (atau AICc atau apa pun). Tetapi Anda biasanya memiliki beberapa keahlian - jika tidak, mengapa Anda menyelidiki variabel-variabel khusus ini?

Peter Flom - Pasang kembali Monica
sumber
2
+1 untuk menekankan perlunya keahlian statistik dan substantif.
chl