Saya mencoba memasukkan satu data deret waktu (tanpa ulangan) menggunakan model regresi. Data terlihat seperti berikut:
> xx.2
value time treat
1 8.788269 1 0
2 7.964719 6 0
3 8.204051 12 0
4 9.041368 24 0
5 8.181555 48 0
6 8.041419 96 0
7 7.992336 144 0
8 7.948658 1 1
9 8.090211 6 1
10 8.031459 12 1
11 8.118308 24 1
12 7.699051 48 1
13 7.537120 96 1
14 7.268570 144 1
Karena kurangnya ulangan, saya memperlakukan waktu sebagai variabel kontinu. Kolom "perlakukan" menunjukkan masing-masing kasing dan data kontrol.
Pertama, saya cocok dengan model "value = time * treat" dengan "lm" di R
:
summary(lm(value~time*treat,data=xx.2))
Call:
lm(formula = value ~ time * treat, data = xx.2)
Residuals:
Min 1Q Median 3Q Max
-0.50627 -0.12345 0.00296 0.04124 0.63785
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 8.493476 0.156345 54.325 1.08e-13 ***
time -0.003748 0.002277 -1.646 0.1307
treat -0.411271 0.221106 -1.860 0.0925 .
time:treat -0.001938 0.003220 -0.602 0.5606
Nilai waktu dan perawatan tidak signifikan.
Sementara dengan anova, saya mendapat hasil berbeda:
summary(aov(value~time*treat,data=xx.2))
Df Sum Sq Mean Sq F value Pr(>F)
time 1 0.7726 0.7726 8.586 0.0150 *
treat 1 0.8852 0.8852 9.837 0.0106 *
time:treat 1 0.0326 0.0326 0.362 0.5606
Residuals 10 0.8998 0.0900
Nilai waktu dan perawatan berubah.
Dengan regresi linier, jika saya benar, itu berarti waktu dan perlakuan tidak memiliki pengaruh signifikan terhadap nilai, tetapi dengan ANOVA, itu berarti waktu dan perlakuan memiliki pengaruh signifikan terhadap nilai.
Bisakah seseorang menjelaskan kepada saya mengapa ada perbedaan dalam dua metode ini, dan mana yang harus digunakan?
lm
danaov
Anda dapat memeriksa mereka menghasilkan cocok identik; misalnya, membandingkan residu mereka denganresiduals
fungsi atau memeriksa koefisien mereka ($coefficients
slot dalam kedua kasus).Jawaban:
Kesesuaian untuk lm () dan aov () identik tetapi pelaporannya berbeda. Tes t adalah dampak marginal dari variabel yang bersangkutan, mengingat keberadaan semua variabel lainnya. Tes F berurutan - sehingga mereka menguji pentingnya waktu di hadapan apa pun kecuali intersepsi, perawatan di hadapan apa pun kecuali intersepsi dan waktu, dan interaksi di hadapan semua hal di atas.
Dengan asumsi Anda tertarik pada pentingnya perawatan, saya sarankan Anda memasukkan dua model, satu dengan, dan satu tanpa, membandingkan keduanya dengan meletakkan kedua model dalam anova (), dan menggunakan uji F itu. Ini akan menguji suguhan dan interaksi secara bersamaan.
Pertimbangkan yang berikut ini:
sumber
aov
.Jawaban Peter Ellis luar biasa, tetapi ada hal lain yang harus dikemukakan. The statistik-test (dan yang -nilai) adalah tes apakah . Uji pada cetakan adalah apakah variabel yang ditambahkan secara signifikan mengurangi jumlah sisa kuadrat.p β = 0 Ft hal β= 0 F
anova()
Uji - adalah urutan-independen, sedangkan uji- tidak. Oleh karena itu saran Peter agar Anda mencoba variabel dalam urutan yang berbeda. Mungkin juga bahwa variabel yang signifikan dalam satu tes mungkin tidak signifikan dalam yang lain (dan sebaliknya).Ft F
Perasaan saya (dan kontributor lainnya dipersilakan untuk mengoreksi saya) adalah bahwa ketika Anda mencoba untuk memprediksi fenomena (seperti dalam aplikasi sistem), Anda paling tertarik untuk mengurangi varians dengan prediktor paling sedikit, dan karenanya menginginkanX y β
anova()
hasilnya. Namun, jika Anda mencoba menetapkan efek marginal pada , Anda akan sangat peduli dengan signifikansi minat Anda, dan semua variabel lain hanya akan mengontrol penjelasan alternatif yang akan dicari oleh pengulas sejawat Anda.y βsumber
Dua jawaban di atas sangat bagus, tetapi saya pikir saya akan menambahkan sedikit lebih banyak. Nugget informasi lain dapat diperoleh dari sini .
Saat Anda melaporkan
lm()
hasil dengan istilah interaksi, Anda mengatakan sesuatu seperti: "memperlakukan 1 berbeda dari memperlakukan 0 (beta! = 0, p = 0,0925), ketika waktu diatur ke nilai dasar 1 ". Sedangkananova()
hasil ( seperti yang disebutkan sebelumnya ) mengabaikan variabel lain dan hanya menyangkut perbedaan varians.Anda dapat membuktikan ini dengan menghapus istilah interaksi Anda dan menggunakan model sederhana dengan hanya dua efek utama ( m1 ):
Dalam hal ini kita melihat bahwa nilai-p yang dilaporkan adalah sama; itu karena dalam kasus model yang lebih sederhana ini,
sumber
summary(lm)
dananova(lm)
tidak akan selalu memberikan hasil yang identik jika tidak ada istilah interaksi. Kebetulan dalam data initime
dan jumlahtreat
ortogonal dan tipe I (berurutan) dan III (marginal) kuadrat menghasilkan hasil yang identik.REPRODUKSI MASALAH
BEBERAPA MODEL YANG DIGUNAKAN DALAM PENJELASAN
BAGAIMANA LM T_TEST BEKERJA DAN TERKAIT DENGAN F-TEST
BAGAIMANA AOV BEKERJA DAN MEMILIH DF DALAM F-TES
CATATAN PENTING
sumber