Ketika menghitung model regresi dengan R, saya secara teratur menggunakan fungsi relevel untuk mendapatkan model saya untuk memberi saya hasil untuk tingkat lain juga. Saya perhatikan bahwa kadang-kadang, tetapi tidak sering, ini mengubah model dalam arti bahwa tingkat faktor-faktor lain yang signifikan sebelum rilis tidak lagi. Apakah ini melekat pada rilis atau luar biasa dan mungkin karena beberapa masalah dengan data saya? Apakah ini menunjukkan bahwa data saya kemungkinan tidak memenuhi salah satu prasyarat model linier?
Terkait dengan itu, apakah boleh jika saya menggunakan relevel, menghitung ulang model saya, dan kemudian melaporkan nilai signifikansi dari kedua model dalam artikel saya? Jika signifikansi berbeda antara dua model untuk faktor tertentu, saya kira saya harus pergi dengan yang kurang optimis?
Saya kira pertanyaan saya mengkhianati bahwa saya tidak cukup tahu tentang saya untuk memahami kebutuhan akan tingkat dasar. Saya pikir saya memahaminya dengan cukup baik;) Entah bagaimana tidak ada perkenalan yang saya baca menjelaskan hal itu, atau saya terlalu bodoh untuk memahami itu. Jadi, jika seseorang dapat mengarahkan saya ke sebuah situs di mana titik memiliki level dasar dalam lm dijelaskan atau dijelaskan sendiri, itu akan menjadi hebat juga!
Sunting: Ini contoh minimal:
library(datasets)
sprays<-OrchardSprays
model<-lm(decrease~treatment+rowpos+colpos,data=sprays)
summary(model)
Bagian dari ringkasan mengatakan
treatmentC 20.625 9.731 2.120 0.03866 *
Jadi jika pengobatan == C ini memiliki pengaruh positif yang signifikan terhadap 'penurunan'. Sekarang saya merilis 'pengobatan' ke B untuk mengetahui apa yang mempengaruhi pengobatan == A:
sprays$treatment<-relevel(sprays$treatment,"B")
summary(model)
Dan sekarang perawatan == C tidak signifikan dalam model baru ini:
treatmentC 17.625 9.731 1.811 0.07567 .
Maaf karena memposting di tempat yang salah! Bisakah saya memindahkan pertanyaan saya ke stats statexchange atau haruskah saya membuka yang baru di sana?
sumber
d <- data.frame(y=runif(300),f=factor(rep(LETTERS[1:3],each=100)); lm(y~f,data=d)
akan memberi Anda permulaan, meskipun tentu saja tidak akan ada perubahan signifikan dalam kasus itu (meskipun estimasi parameter dan nilai-p pasti akan berubah ketika Anda merilis).Jawaban:
Misalkan faktor
conditions
memiliki levelA,B,C
dan Anda regresi variabel respons Anday
pada kondisi menggunakanmod <- lm(y ~ conditions)
. Sekarangsummary(mod)
kembali mean dari tingkat referensi dariconditions
(katakanlahA
) dan perbedaan berarti antara kondisiB
danA
dan perbedaan antara kondisiC
danA
(dilaporkan masing-masing sebagai(Intercept)
,conditions:B
, danconditions:C
). Jika Andaconditions <- relevel(conditions, ref = 'B')
dan menyatukan kembali model linier, sekarang Anda akan mendapatkan rata-rataB
, perbedaan antaraA
danB
, dan perbedaan antaraC
danA
. Secara alami, nilai-p mungkin berubah. Itu tidak berarti ada masalah dengan data Anda. Itu tidak berarti data Anda pasti gagal dengan asumsi model linear. Kesesuaiannya sama dan Anda baru saja mengubah informasi apa yang dicetak karena Anda telah mengubah level referensi dan menggunakan kontras perawatan. Anda bisa mendapatkan tes hipotesis linier yang sama menggunakan yang aslimod
.Sejauh apa yang harus dilaporkan, di banyak bidang, adalah kebiasaan untuk melaporkan apakah ada pengaruh signifikan secara statistik
conditions
(menggunakan outputanova(mod)
) dan melaporkan ke output regresi penuh dalam tabel (menggunakan level referensi apa pun yang Anda inginkan ). Norma untuk bagaimana dan apakah melaporkan tesA
vsB
(misalnya) bervariasi berdasarkan bidang. Perhatikan baik-baik surat kabar di bidang Anda.sumber