Saya ingin melakukan analisis data ANCOVA mengenai kepadatan epifit tanaman. Pada awalnya, saya ingin tahu apakah ada perbedaan dalam kepadatan tanaman antara dua lereng, satu N dan satu S, tetapi saya memiliki data lain seperti ketinggian, keterbukaan kanopi dan ketinggian tanaman inang. Saya tahu bahwa kovariat saya haruslah dua lereng (N dan S). Saya membangun model ini yang berjalan di R dan meskipun saya tidak tahu apakah itu berkinerja baik. Saya juga ingin tahu apa bedanya jika saya menggunakan simbol +
atau *
.
model1 <- aov(density~slope+altitude+canopy+height)
summary(model1)
model1
Jawaban:
Alat dasar untuk ini adalah
lm
; perhatikan ituaov
adalah pembungkus untuklm
.Secara khusus, jika Anda memiliki beberapa variabel pengelompokan (faktor),g , dan kovariat x kontinu , model
y ~ x + g
akan cocok dengan efek utama model ANCOVA, sementaray ~ x * g
akan sesuai dengan model yang mencakup interaksi dengan kovariat.aov
akan mengambil formula yang sama.Berikan perhatian khusus
Note
pada bantuan padaaov
.Adapun
+
vs*
, russellpierce cukup banyak membahasnya, tapi saya sarankan Anda melihat?lm
dan?formula
dan terutama bagian 11.1 dari manual Pengantar R yang datang dengan R (atau Anda dapat menemukannya online jika Anda belum mengetahui caranya untuk menemukannya di komputer Anda; paling mudah, ini melibatkan menemukan menu tarik "Bantuan" di R atau RStudio).sumber
anova
(Anda akan segera melihat apakah Anda memberikannya dengan urutan yang salah karena beberapa SS akan negatif jika Anda melakukannya). )Saya sarankan mendapatkan dan membaca Statistik Penemuan menggunakan R oleh Bidang. Dia memiliki bagian yang bagus tentang ANCOVA.
Untuk menjalankan ANCOVA di R, muat paket berikut:
Jika Anda menggunakan
lm
atauaov
(saya menggunakanaov
) pastikan bahwa Anda mengatur kontras menggunakan fungsi "kontras" sebelum melakukan salah satuaov
ataulm
. R menggunakan kontras non-ortogonal secara default yang dapat mengacaukan semuanya dalam ANCOVA. Jika Anda ingin mengatur kontras ortogonal, gunakan:kemudian jalankan model Anda sebagai
Untuk melihat model, gunakan:
Pastikan Anda menggunakan modal "A" di
Anova
sini dan tidakanova
. Ini akan memberikan hasil menggunakan tipe III SS.summary.lm(model.1)
akan memberikan ringkasan lain dan menyertakan R-sq. keluaran.Jika Anda ingin menguji homogenitas lereng regresi, Anda juga dapat memasukkan istilah interaksi untuk IV dan kovariat. Itu akan menjadi:
Jika istilah interaksi signifikan maka Anda tidak memiliki homogenitas.
sumber
Berikut ini adalah dokumentasi pelengkap http://goo.gl/yxUZ1R tentang prosedur yang disarankan oleh @Butorovich. Selain itu, pengamatan saya adalah bahwa ketika kovariat adalah biner, menggunakan ringkasan (lm.object) akan memberikan estimasi IV yang sama seperti yang dihasilkan oleh Anova (lm.object, type = "III").
sumber
ASK QUESTION
di bagian atas & menanyakannya di sana. Maka kami dapat membantu Anda dengan baik.Kami menggunakan analisis Regresi untuk membuat model yang menggambarkan pengaruh variasi dalam variabel prediktor pada variabel respons. Kadang-kadang jika kita memiliki variabel kategori dengan nilai-nilai seperti Ya / Tidak atau Pria / Wanita dll. Analisis regresi sederhana memberikan beberapa hasil untuk setiap nilai dari variabel kategori. Dalam skenario seperti itu, kita dapat mempelajari pengaruh variabel kategori dengan menggunakannya bersama dengan variabel prediktor dan membandingkan garis regresi untuk setiap tingkat variabel kategori. Analisis semacam ini disebut sebagai Analisis Kovarian juga disebut sebagai ANCOVA.
Contoh
Pertimbangkan
R
kumpulan data bawaanmtcars
. Di dalamnya kami mengamati bahwa bidang tersebutam
mewakili jenis transmisi (otomatis atau manual). Ini adalah variabel kategori dengan nilai 0 dan 1. Nilai mil per galon (mpg
) mobil juga dapat bergantung padanya di samping nilai tenaga kuda (hp
). Kami mempelajari pengaruh nilaiam
pada regresi antarampg
danhp
. Ini dilakukan dengan menggunakanaov()
fungsi diikuti olehanova()
fungsi untuk membandingkan regresi berganda.Input Data
Buat bingkai data yang berisi bidang
mpg
,hp
danam
dari kumpulan datamtcars
. Di sini kita ambilmpg
sebagai variabel respon,hp
sebagai variabel prediktor danam
sebagai variabel kategorikal.Ketika kami mengeksekusi kode di atas, itu menghasilkan hasil sebagai berikut:
Analisis ANCOVA
Kami membuat model regresi dengan mengambil
hp
sebagai variabel prediktor danmpg
sebagai variabel respon dengan mempertimbangkan interaksi antaraam
danhp
.Model dengan interaksi antara variabel kategori dan variabel prediktor
Buat model regresi1
Ketika kami mengeksekusi kode di atas, itu menghasilkan hasil sebagai berikut:
Hasil ini menunjukkan bahwa tenaga kuda dan tipe transmisi memiliki efek yang signifikan pada mil per galon karena nilai-p dalam kedua kasus kurang dari 0,05. Tetapi interaksi antara kedua variabel ini tidak signifikan karena p-value lebih dari 0,05.
Model tanpa interaksi antara variabel kategori dan variabel prediktor
Buat model regresi2
Ketika kami mengeksekusi kode di atas, itu menghasilkan hasil sebagai berikut:
Hasil ini menunjukkan bahwa tenaga kuda dan tipe transmisi memiliki efek yang signifikan pada mil per galon karena nilai-p dalam kedua kasus kurang dari 0,05.
Membandingkan dua model
Sekarang kita dapat membandingkan dua model untuk menyimpulkan jika interaksi variabel benar-benar tidak signifikan. Untuk ini kami menggunakan
anova()
fungsi.Karena nilai p lebih besar dari 0,05, kami menyimpulkan bahwa interaksi antara tenaga kuda dan jenis transmisi tidak signifikan. Jadi jarak tempuh per galon akan tergantung pada cara yang sama pada tenaga kuda mobil dalam mode transmisi otomatis dan manual.
sumber