Inti dari AIC atau kriteria informasi lainnya adalah bahwa lebih sedikit lebih baik. Jadi jika saya memiliki dua model M1: y = a0 + XA + e dan M2: y = b0 + ZB + u, dan jika AIC yang pertama (A1) kurang dari yang kedua (A2), maka M1 memiliki lebih cocok dari sudut pandang teori informasi. Tetapi apakah ada patokan batas untuk perbedaan A1-A2? Berapa jauh sebenarnya lebih sedikit? Dengan kata lain, apakah ada tes untuk (A1-A2) selain hanya sekedar eyeballing?
Sunting: Peter / Dmitrij ... Terima kasih telah merespons. Sebenarnya, ini adalah kasus di mana keahlian substantif saya bertentangan dengan keahlian statistik saya. Pada dasarnya, masalahnya BUKAN memilih antara dua model, tetapi dalam memeriksa apakah dua variabel yang saya tahu sebagian besar setara menambahkan jumlah informasi yang setara (Sebenarnya, satu variabel dalam model pertama dan vektor di yang kedua. Pikirkan tentang kasus sekelompok variabel terhadap indeks mereka.). Seperti Dmitrij tunjukkan, taruhan terbaik tampaknya adalah Tes Cox. Tetapi apakah ada cara untuk benar-benar menguji perbedaan antara isi informasi kedua model?
sumber
Jawaban:
Apakah pertanyaan tentang rasa ingin tahu, yaitu Anda tidak puas dengan jawaban saya di sini ? Jika tidak...
Penyelidikan lebih lanjut dari pertanyaan rumit ini menunjukkan bahwa memang ada aturan umum yang digunakan, yang menyatakan dua model tidak dapat dibedakan oleh kriteria jika perbedaannya . Hal yang sama Anda benar-benar akan baca di artikel wikipedia di (perhatikan tautannya dapat diklik!). Hanya untuk mereka yang tidak mengklik tautan:| A I C 1 - A I C 2 | < 2 A I CA IC | AIC1- A IC2| <2 A IC
Penjelasan yang bagus dan saran yang bermanfaat, menurut saya. Hanya saja, jangan takut membaca apa yang bisa diklik!
Selain itu , perhatikan sekali lagi, kurang disukai untuk set data skala besar. Selain Anda mungkin menemukan berguna untuk diterapkan versi bias-dikoreksi dari kriteria (Anda dapat menggunakan ini kode atau menggunakan rumus , di mana adalah jumlah taksiran parameter). Aturan praktisnya akan sama. B I C A I C A I C c A I C c = A I C + 2 p ( p + 1 )AIC BIC AIC AICc AICc=AIC+2p(p+1)n−p−1 p
R
psumber
Burnham, K. P., and Anderson, D.R. (2002). Model Selection and Multimodel Inference: A Practical Information-Theoretic Approach, 2nd ed. Springer-Verlag. ISBN 0-387-95364-7.
dan halaman Wiki pra-revisi ada di siniSaya pikir ini mungkin upaya untuk mendapatkan apa yang tidak Anda inginkan.
Pemilihan model bukanlah ilmu. Kecuali dalam keadaan langka, tidak ada satu model sempurna, atau bahkan satu model "benar"; jarang ada satu pun model "terbaik". Diskusi tentang AIC vs AICc vs BIC vs SBC vs apa pun membuat saya agak tidak tertarik. Saya pikir idenya adalah untuk mendapatkan beberapa model BAIK. Anda kemudian memilih di antara mereka berdasarkan pada kombinasi keahlian substantif dan gagasan statistik. Jika Anda tidak memiliki keahlian substantif (jarang terjadi; jauh lebih jarang daripada yang diperkirakan kebanyakan orang) maka pilih AIC terendah (atau AICc atau apa pun). Tetapi Anda biasanya memiliki beberapa keahlian - jika tidak, mengapa Anda menyelidiki variabel-variabel khusus ini?
sumber