Saya mencoba menentukan apakah ulat yang memakan makanan alami (bunga kera) lebih tahan terhadap predator (semut) daripada ulat yang memakan makanan buatan (campuran kuman gandum dan vitamin). Saya melakukan studi percobaan dengan ukuran sampel kecil (20 ulat; 10 per diet). Saya menimbang masing-masing ulat sebelum percobaan. Saya menawarkan sepasang ulat (satu per diet) kepada sekelompok semut selama lima menit, dan menghitung berapa kali setiap ulat ditolak. Saya mengulangi proses ini sepuluh kali.
Seperti inilah data saya (A = diet buatan, N = diet alami):
Trial A_Weight N_Weight A_Rejections N_Rejections
1 0.0496 0.1857 0 1
2 0.0324 0.1112 0 2
3 0.0291 0.3011 0 2
4 0.0247 0.2066 0 3
5 0.0394 0.1448 3 1
6 0.0641 0.0838 1 3
7 0.0360 0.1963 0 2
8 0.0243 0.145 0 3
9 0.0682 0.1519 0 3
10 0.0225 0.1571 1 0
Saya mencoba menjalankan ANOVA di R. Beginilah kode saya terlihat (0 = Makanan buatan, 1 = Makanan alami; semua vektor diatur dengan data untuk sepuluh ulat makanan buatan pertama, diikuti oleh data untuk sepuluh makanan alami ulat):
diet <- factor (rep (c (0, 1), each = 10)
rejections <- c(0,0,0,0,3,1,0,0,0,1,1,2,2,3,1,3,2,3,3,0)
weight <- c(0.0496,0.0324,0.0291,0.0247,0.0394,0.0641,0.036,0.0243,0.0682,0.0225,0.1857,0.1112,0.3011,0.2066,0.1448,0.0838,0.1963,0.145,0.1519,0.1571)
all.data <- data.frame(Diet=diet, Rejections = rejections, Weight = weight)
fit.all <- lm(Rejections ~ Diet * Weight, all.data)
anova(fit.all)
Dan ini adalah apa hasil saya terlihat:
Analysis of Variance Table
Response: Rejections
Df Sum Sq Mean Sq F value Pr(>F)
Diet 1 11.2500 11.2500 9.8044 0.006444 **
Weight 1 0.0661 0.0661 0.0576 0.813432
Diet:Weight 1 0.0748 0.0748 0.0652 0.801678
Residuals 16 18.3591 1.1474
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Pertanyaan saya adalah:
- Apakah ANOVA cocok di sini? Saya menyadari ukuran sampel yang kecil akan menjadi masalah dengan uji statistik apa pun; ini hanya sebuah studi percobaan yang saya ingin menjalankan statistik untuk presentasi kelas. Saya berencana untuk mengulang penelitian ini dengan ukuran sampel yang lebih besar.
- Sudahkah saya memasukkan data saya ke R dengan benar?
- Apakah ini memberitahu saya bahwa diet itu penting, tetapi berat badan tidak?
Jawaban:
tl; dr @whuber benar bahwa diet dan berat badan dikacaukan dalam analisis Anda: seperti inilah gambarannya.
Titik-titik lemak + rentang menunjukkan interval kepercayaan rata-rata dan bootstrap untuk diet saja; interval garis abu-abu + keyakinan menunjukkan hubungan keseluruhan dengan berat badan; garis individual + CI menunjukkan hubungan dengan bobot untuk masing-masing kelompok. Ada lebih banyak penolakan untuk diet = N, tetapi orang-orang itu juga memiliki bobot lebih tinggi.
Masuk ke detail mekanis berdarah: Anda berada di jalur yang benar dengan analisis Anda, tetapi (1) ketika Anda menguji efek diet, Anda harus memperhitungkan efek berat badan, dan sebaliknya ; secara default R melakukan ANOVA berurutan , yang menguji efek diet saja; (2) untuk data seperti ini, Anda mungkin harus menggunakan Poisson generalized linear model (GLM), meskipun tidak terlalu banyak membuat perbedaan dengan kesimpulan statistik dalam kasus ini.
Jika Anda melihat
summary()
alih-alihanova()
, yang menguji efek marginal, Anda akan melihat bahwa tidak ada yang terlihat sangat signifikan (Anda juga harus berhati-hati dengan menguji efek utama di hadapan interaksi: dalam hal ini efek diet dievaluasi pada tingkat Bobot nol : mungkin tidak masuk akal, tetapi karena interaksinya tidak signifikan (walaupun memiliki efek besar!) mungkin tidak membuat banyak perbedaan.Memusatkan variabel bobot:
Tidak ada perubahan besar dalam cerita di sini.
Ada beberapa argumen tentang apakah yang disebut tes "tipe 3" masuk akal; mereka tidak selalu, meskipun memusatkan berat badan membantu. Analisis tipe 2, yang menguji efek utama setelah mengeluarkan interaksi dari model, mungkin lebih dapat dipertahankan. Dalam hal ini, diet dan berat badan diuji di hadapan satu sama lain, tetapi tanpa interaksi.
Kita dapat melihat bahwa jika kita menganalisis pola makan mengabaikan efek berat badan kita akan mendapatkan hasil yang sangat signifikan - ini pada dasarnya adalah apa yang Anda temukan dalam analisis Anda, karena ANOVA berurutan.
Akan lebih standar untuk mencocokkan data semacam ini dengan Poisson GLM (
glm(rejections~diet*cweight,data=dd2,family=poisson)
), tetapi dalam kasus ini tidak banyak membuat perbedaan pada kesimpulan.Ngomong-ngomong, lebih baik mengatur ulang data Anda secara terprogram daripada dengan tangan jika Anda bisa. Untuk referensi, ini adalah bagaimana saya melakukannya (maaf untuk jumlah "sihir" yang saya gunakan):
Merencanakan kode:
sumber