Karena pemodelan regresi seringkali lebih "seni" daripada sains, saya sering menemukan diri saya menguji banyak iterasi dari struktur regresi. Apa saja cara efisien untuk meringkas informasi dari berbagai model ini dalam upaya menemukan model "terbaik"? Salah satu pendekatan yang saya gunakan adalah memasukkan semua model ke dalam daftar dan berjalan summary()
melintasi daftar itu, tetapi saya membayangkan ada cara yang lebih efisien untuk membandingkan?
Kode & model sampel:
ctl <- c(4.17,5.58,5.18,6.11,4.50,4.61,5.17,4.53,5.33,5.14)
trt <- c(4.81,4.17,4.41,3.59,5.87,3.83,6.03,4.89,4.32,4.69)
group <- gl(2,10,20, labels=c("Ctl","Trt"))
weight <- c(ctl, trt)
lm1 <- lm(weight ~ group)
lm2 <- lm(weight ~ group - 1)
lm3 <- lm(log(weight) ~ group - 1)
#Draw comparisions between models 1 - 3?
models <- list(lm1, lm2, lm3)
lapply(models, summary)
r
regression
Mengejar
sumber
sumber
Jawaban:
Plot mereka!
http://svn.cluelessresearch.com/tables2graphs/longley.png
Atau, jika Anda harus, gunakan tabel: Paket apsrtable atau
mtable
fungsi dalam paket memisc .Menggunakan
mtable
sumber
grid
, bukanlattice
:)memisc
sebelumnya, sepertinya paket yang sangat berguna untuk dimiliki seseorang!Berikut ini tidak menjawab pertanyaan dengan tepat. Ini mungkin memberi Anda beberapa ide. Ini sesuatu yang baru-baru ini saya lakukan untuk menilai kecocokan beberapa model regresi menggunakan satu hingga empat variabel independen (variabel dependen ada di kolom pertama dari kerangka data df1).
Isi as.character (formlist) tadinya
Kemudian saya mengumpulkan beberapa indeks yang bermanfaat
Kerangka data terakhir adalah
Akhirnya, plot Cp (menggunakan library wle)
sumber