Saya tertarik untuk memprediksi Y
dan saya mempelajari dua teknik pengukuran yang berbeda X1
dan X2
. Bisa jadi misalnya saya ingin memprediksi rasa pisang, baik dengan mengukur berapa lama sudah tergeletak di atas meja, atau dengan mengukur jumlah bintik-bintik coklat pada pisang.
Saya ingin tahu mana salah satu teknik pengukuran yang lebih baik, haruskah saya memilih untuk melakukan hanya satu.
Saya dapat membuat model linier di R:
m1 = lm(Y ~ X1)
m2 = lm(Y ~ X2)
Sekarang katakanlah X1
adalah prediktor unggul dari rasa pisang daripada X2
. Saat menghitung dari dua model, model jelas lebih tinggi dari model . Sebelum menulis makalah tentang bagaimana metode lebih baik daripada , saya ingin memiliki semacam indikasi bahwa perbedaannya bukan karena kebetulan, mungkin dalam bentuk nilai-p.m1
m2
X1
X2
Bagaimana orang akan melakukan ini? Bagaimana cara melakukannya ketika saya menggunakan berbagai merek pisang dan beralih ke model Linear Mixed Effect yang memasukkan merek pisang sebagai efek acak?
X1
danX2
mungkin akan dikorelasikan, karena bintik-bintik coklat mungkin meningkat dengan meningkatnya waktu berbaring di atas meja.Jawaban:
Kemudian
Satu hal yang ingin saya tambahkan setelah mendengar bahwa Anda memiliki model efek campuran linier: dan masih dapat digunakan untuk membandingkan model. Lihat tulisan ini , misalnya. Dari pertanyaan serupa lainnya di situs, tampaknya makalah ini sangat penting.AIC,AICc BIC
Jawaban asli
Pada dasarnya yang Anda inginkan adalah membandingkan dua model yang tidak bersarang. Seleksi Model Burnham dan Anderson dan inferensi multimodel membahas hal ini dan merekomendasikan penggunaan , atau dll. Karena uji rasio kemungkinan tradisional hanya berlaku pada model bersarang. Mereka secara eksplisit menyatakan bahwa kriteria informasi-teoretis seperti dll. Bukan tes dan bahwa kata "signifikan" harus dihindari ketika melaporkan hasil.AIC AICc BIC AIC,AICc,BIC
Berdasarkan ini dan ini jawaban, saya sarankan ini pendekatan:
pairs(Y~X1+X2, panel = panel.smooth, lwd = 2, cex = 1.5, col = "steelblue", pch=16)
. Periksa apakah garis (smoothers) kompatibel dengan hubungan linier. Sempurnakan model jika perlu.m1
danm2
. Lakukan beberapa pengecekan model (residu, dll.):plot(m1)
Danplot(m2)
.R
pscl
AICc
abs(AICc(m1)-AICc(m2))
R
paketlmtest
memiliki fungsicoxtest
(uji Cox),jtest
(uji Davidson-MacKinnon J) danencomptest
(uji meliputi dari Davidson & MacKinnon).Beberapa pemikiran: Jika dua ukuran pisang benar - benar mengukur hal yang sama, keduanya mungkin sama - sama cocok untuk prediksi dan mungkin tidak ada model "terbaik".
Makalah ini mungkin juga bermanfaat.
Berikut adalah contoh dalam
R
:Para smoothers mengkonfirmasi hubungan linier. Ini dimaksudkan, tentu saja.
The dari model pertama jelas lebih rendah dan jauh lebih tinggi.AICc R2
m1
Penting: Dalam model linier dengan kompleksitas yang sama dan distribusi kesalahan Gaussian , dan harus memberikan jawaban yang sama (lihat posting ini ). Dalam model nonlinear , penggunaan untuk kinerja model (goodness of fit) dan pemilihan model harus dihindari: lihat posting ini dan makalah ini , misalnya.R2,AIC BIC R2
sumber
lmtest
paket tersebut. Sebelum saya terjun ke literatur yang menulis tentang tes mirip cox dengan LME, apakah ada yang tahu paket R yang tersedia untuk melakukannya?R
paket apa pun yang bisa melakukan itu. Mungkin posting ini bisa memberi Anda panduan lebih lanjut.Ada jawaban abad ke-19 yang bagus yang berisiko diabaikan di sini. Untuk membandingkan dua garis lurus yang berbeda, plot data dan garis yang cocok dan pikirkan apa yang Anda lihat. Sangat mungkin bahwa satu model akan jelas lebih baik, dan itu tidak berarti lebih tinggi . Sebagai contoh, ada kemungkinan bahwa model garis lurus secara kualitatif salah dalam satu atau lain kasus. Bahkan lebih baik, data dan kecocokan mungkin menyarankan model yang lebih baik. Jika kedua model muncul tentang sama-sama baik atau buruk, itu jawaban lain.R2
Contoh pisang mungkin bercanda di sini, tapi saya tidak berharap garis lurus cocok untuk bekerja sama sekali ....
Mesin inferensial yang dibuat oleh orang lain sebagai jawaban adalah sesuatu yang indah secara intelektual, tetapi kadang-kadang Anda tidak perlu palu godam canggih untuk memecahkan masalah. Kadang-kadang tampak bahwa siapa pun yang menerbitkan malam itu lebih gelap daripada siang akan selalu memiliki seseorang yang bertanya, "Apakah Anda mengujinya secara formal? Apa nilai P Anda?".
sumber
Lakukan tes Cox untuk model yang tidak bersarang.
(Anda akan menemukan referensi untuk tes lain).
Lihat juga komentar ini dan pertanyaan ini . Khususnya, pertimbangkan untuk menggunakan AIC / BIC.
sumber