Mengapa menerapkan pemilihan model menggunakan AIC memberi saya nilai p tidak signifikan untuk variabel

14

Saya memiliki beberapa pertanyaan tentang AIC dan berharap Anda dapat membantu saya. Saya menerapkan pemilihan model (mundur, atau maju) berdasarkan AIC pada data saya. Dan beberapa variabel yang dipilih berakhir dengan nilai p> 0,05. Saya tahu bahwa orang-orang mengatakan kita harus memilih model berdasarkan AIC dan bukan nilai-p, jadi sepertinya AIC dan nilai-p adalah dua konsep perbedaan. Bisakah seseorang memberi tahu saya apa perbedaannya? Apa yang saya pahami sejauh ini adalah:

  1. Untuk seleksi mundur menggunakan AIC, misalkan kita memiliki 3 variabel (var1, var2, var3) dan AIC dari model ini adalah AIC *. Jika mengecualikan salah satu dari ketiga variabel ini tidak akan berakhir dengan AIC yang secara signifikan lebih rendah dari AIC * (dalam hal distribusi ch-square dengan df = 1), maka kita dapat mengatakan ketiga variabel ini adalah hasil akhir.

  2. Nilai p yang signifikan untuk suatu variabel (misalnya var1) dalam model tiga variabel berarti bahwa ukuran efek standar dari variabel tersebut secara signifikan berbeda dari 0 (menurut Wald, atau uji-t).

Apa perbedaan mendasar antara kedua metode ini? Bagaimana saya mengartikannya jika ada beberapa variabel yang memiliki nilai p tidak signifikan dalam model terbaik saya (diperoleh melalui AIC)?

tiantianchen
sumber

Jawaban:

13

AIC dan variannya lebih dekat dengan variasi pada kemudian pada p-nilai masing-masing regressor. Lebih tepatnya, mereka adalah versi-versi dari kemungkinan log.R2

Anda tidak ingin menguji perbedaan AIC menggunakan chi-squared. Anda bisa menguji perbedaan kemungkinan log menggunakan chi-squared (jika model bersarang). Untuk AIC, lebih rendah lebih baik (dalam sebagian besar implementasi itu, pula). Tidak perlu penyesuaian lebih lanjut.

Anda benar-benar ingin menghindari metode pemilihan model otomatis, jika memungkinkan. Jika Anda harus menggunakannya, coba LASSO atau LAR.

Peter Flom - Pasang kembali Monica
sumber
2
Terima kasih atas jawabannya. Ya kamu benar. AIC tidak menerapkan tes apa pun, sebagai gantinya, itu memberikan ukuran sederhana tentang seberapa baik model cocok dengan sampel dan apakah model dapat tetap sederhana juga, dengan menambahkan kemungkinan log -2 * dengan 2 * number_of_parameters. Mungkin ini menjelaskan mengapa variabel dengan nilai p tidak signifikan disimpan dalam model yang dipilih?
tiantianchen
Model mana yang harus kita pilih jika kita memiliki dua model dengan AIC yang hampir identik, tetapi dalam satu kita memiliki istilah yang lebih signifikan daripada yang lain?
Agus Camacho
Apapun yang kamu mau.
Peter Flom - Pasang kembali Monica
11

χ12

Jadi tidak mengherankan jika Anda membandingkannya dengan menggunakan beberapa cutoff yang lebih kecil untuk nilai-p yang kadang-kadang menyertakan variabel dengan nilai p yang lebih tinggi daripada cutoff itu.

Glen_b -Reinstate Monica
sumber
dapatkah Anda mengarahkan saya ke url atau referensi untuk koneksi antara AIC dan nilai-p melalui Wal chi-square? Terima kasih.
meh
Ini relatif mudah untuk ditunjukkan dengan menggunakan nilai 2 sebagai nilai kritis, yang sesuai dengan ambang batas p-value 15,73% (ketika derajat kebebasan tes adalah 1, seperti halnya dalam pemilihan bertahap menggunakan regresi linier model dan variabel kontinu). Ini dapat dihitung sebagai 1-chi2cdf (2,1).
George
@ Aginensky Belum melihat referensi yang sebenarnya, meskipun koneksi langsung. Saya membayangkan saya dapat google one up, tunggu.
Glen_b -Reinstate Monica
@aginensky Lindsey, JK & Jones, B. (1998) Memilih di antara model linier umum yang diterapkan pada data medis. Statistik dalam Kedokteran , 17, 59-68. ... lihat tengah halaman 62. Akan ada lebih banyak.
Glen_b -Reinstate Monica
@ Glen_b- terima kasih, saya belum pernah melihat yang seperti itu sebelumnya.
meh
9

Perhatikan bahwa tidak ada nilai p atau AIC yang dirancang untuk pemilihan model bertahap, pada kenyataannya asumsi yang mendasari keduanya (tetapi asumsi yang berbeda) dilanggar setelah langkah pertama dalam regresi bertahap. Seperti @PeterFlom sebutkan, LASSO dan / atau LAR adalah alternatif yang lebih baik jika Anda merasa perlu untuk pemilihan model otomatis. Metode-metode tersebut menarik perkiraan yang besar secara kebetulan (yang secara bertahap memberikan hadiah untuk kesempatan) kembali ke 0 dan karenanya cenderung kurang bias daripada bertahap (dan bias yang tersisa cenderung lebih konservatif).

Masalah besar dengan AIC yang sering diabaikan adalah ukuran perbedaan dalam nilai-nilai AIC, itu semua umum untuk melihat "lebih rendah lebih baik" dan berhenti di situ (dan proses otomatis hanya menekankan ini). Jika Anda membandingkan 2 model dan mereka memiliki nilai AIC yang sangat berbeda, maka ada preferensi yang jelas untuk model dengan AIC yang lebih rendah, tetapi seringkali kita akan memiliki 2 (atau lebih) model dengan nilai AIC yang dekat satu sama lain, di kasus ini hanya menggunakan model dengan nilai AIC terendah akan kehilangan informasi berharga (dan menyimpulkan hal-hal tentang istilah yang ada dalam atau tidak dalam model ini tetapi berbeda dalam model serupa lainnya akan menjadi tidak berarti atau lebih buruk). Informasi dari luar data itu sendiri (seperti seberapa keras / mahal) mengumpulkan kumpulan variabel prediktor) dapat membuat model dengan AIC yang sedikit lebih tinggi lebih diinginkan untuk digunakan tanpa banyak kehilangan kualitas. Pendekatan lain adalah dengan menggunakan rata-rata tertimbang dari model yang sama (ini mungkin akan menghasilkan prediksi akhir yang serupa dengan metode hukuman seperti regresi ridge atau laso, tetapi proses pemikiran yang mengarah ke model mungkin membantu dalam pemahaman).

Greg Snow
sumber
Terima kasih @GregSnow atas jawaban Anda. Bolehkah saya bertanya apa saja asumsi (berbeda) untuk pemilihan model nilai-p dan berbasis AIC? Akankah menerapkan dua arah (maju / mundur) atau mencoba subset penuh kurang lebih akan menyelesaikan masalah menemukan model penyederhanaan lokal yang optimal dengan menggunakan seleksi bertahap maju atau mundur? (walaupun masalah overfitting selalu ada dalam metode AIC / p-value dan LASSO dan / atau LAR adalah pilihan yang lebih baik)
tiantianchen
Karena tidak ada nilai p atau AIC yang dirancang untuk pemilihan model, mereka tidak memiliki asumsi untuk pemilihan model. Keduanya dirancang untuk melakukan perbandingan tunggal, pikirkan berapa banyak perbandingan yang terjadi dalam regresi bertahap, apakah Anda benar-benar berpikir bahwa langkah "terbaik" diambil setiap kali?
Greg Snow
@GregSnow. Referensi saya untuk mempelajari AIC adalah ini - stat.cmu.edu/~larry/=stat705/Lecture16.pdf yang tampaknya menempatkan AIC dalam bisnis pemilihan model. Selain itu, ketika saya melihat AIC digunakan dalam model arima seri waktu, selalu digunakan untuk pemilihan model.
meh
@aginensky, Ya, AIC (dan lainnya) digunakan untuk pemilihan model. Itu tidak berarti bahwa AIC dirancang untuk pemilihan model, atau bahkan cocok untuk pemilihan model, atau bahwa pemilihan model otomatis menjawab pertanyaan yang bermakna. Saya telah menggunakan obeng sebagai palu sebelumnya, itu tidak berarti bahwa itu adalah ide yang baik secara umum.
Greg Snow
"Makalah ini menjelaskan bagaimana masalah pemilihan model statistik dapat secara sistematis ditangani dengan menggunakan kriteria informasi (AIC) yang diperkenalkan oleh penulis pada tahun 1971" dari Akaike, "Pandangan baru pada identifikasi model statistik". Jadi, bahkan jika AIC adalah palu yang digunakan pada masalah yang paling baik diselesaikan oleh obeng, itu adalah pandangan dari perancang palu ini, bahwa palu adalah cara yang tepat untuk menyelesaikan masalah ini. Benar atau salah, AIC dirancang untuk pemilihan model. Saya akan senang melihat pandangan AIC yang berbeda. Jangan ragu untuk menjawab ini, tapi saya sudah selesai.
meh
1

Pengalaman saya dengan AIC adalah bahwa jika variabel nampak tidak signifikan, tetapi masih muncul dalam model dengan AIC terkecil, itu menjadi kemungkinan pembaur.

Saya sarankan Anda memeriksa pembaur. Menghapus variabel yang tidak signifikan seperti itu harus mengubah magnetude dari beberapa koefisien yang diperkirakan tersisa lebih dari 25%.

Adiaba
sumber
Tolong jelaskan bagaimana OP "dapat memeriksa pembaur."
Jim
0

Saya pikir pemilihan model terbaik adalah dengan menggunakan paket MuMIn. Ini akan menjadi hasil langkah pertama dan Anda tidak perlu mencari nilai AIC terendah. Contoh:

d<-read.csv("datasource")
library(MuMIn)
fit<-glm(y~x1+x2+x3+x4,family=poisson,data=d)
get.models(dredge(fit,rank="AIC"))[1]
Ravi Mohan Tiwari
sumber
2
Mengatakan kode apa yang mungkin Anda gunakan tidak benar-benar menjawab pertanyaan kecuali Anda dapat menjelaskan bagaimana hal itu menjawab pertanyaan secara statistik. Dalam kasus apa pun tidak ada dalam pertanyaan khusus untuk perangkat lunak tertentu.
Nick Cox