Saya menggunakan pustaka R 'multcomp' ( http://cran.r-project.org/web/packages/multcomp/ ) untuk menghitung tes Dunnett. Saya menggunakan skrip di bawah ini:
Group <- factor(c("A","A","B","B","B","C","C","C","D","D","D","E","E","F","F","F"))
Value <- c(5,5.09901951359278,4.69041575982343,4.58257569495584,4.79583152331272,5,5.09901951359278,4.24264068711928,5.09901951359278,5.19615242270663,4.58257569495584,6.16441400296898,6.85565460040104,7.68114574786861,7.07106781186548,6.48074069840786)
data <- data.frame(Group, Value)
aov <- aov(Value ~ Group, data)
summary(glht(aov, linfct=mcp(Group="Dunnett")))
Sekarang jika saya menjalankan skrip ini melalui Konsol R beberapa kali, saya mendapatkan hasil yang sedikit berbeda setiap kali. Ini salah satu contohnya:
Simultaneous Tests for General Linear Hypotheses
Multiple Comparisons of Means: Dunnett Contrasts
Fit: aov(formula = Value ~ Group, data = data)
Linear Hypotheses:
Estimate Std. Error t value Pr(>|t|)
B - A == 0 -0.35990 0.37009 -0.972 0.76545
C - A == 0 -0.26896 0.37009 -0.727 0.90019
D - A == 0 -0.09026 0.37009 -0.244 0.99894
E - A == 0 1.46052 0.40541 3.603 0.01710 *
F - A == 0 2.02814 0.37009 5.480 0.00104 **
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
(Adjusted p values reported -- single-step method)
Dan ini satu lagi:
Simultaneous Tests for General Linear Hypotheses
Multiple Comparisons of Means: Dunnett Contrasts
Fit: aov(formula = Value ~ Group, data = data)
Linear Hypotheses:
Estimate Std. Error t value Pr(>|t|)
B - A == 0 -0.35990 0.37009 -0.972 0.7654
C - A == 0 -0.26896 0.37009 -0.727 0.9001
D - A == 0 -0.09026 0.37009 -0.244 0.9989
E - A == 0 1.46052 0.40541 3.603 0.0173 *
F - A == 0 2.02814 0.37009 5.480 <0.001 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
(Adjusted p values reported -- single-step method)
Seperti yang Anda lihat, dua hasil di atas berbeda sangat sedikit, tetapi cukup untuk memindahkan grup terakhir (F) dari dua bintang menjadi tiga bintang, yang menurut saya mengkhawatirkan.
Saya punya beberapa pertanyaan tentang ini:
- Kenapa ini terjadi ?! Tentunya jika Anda memasukkan data yang sama di setiap kali Anda harus mengeluarkan data yang sama.
- Apakah ada semacam nomor acak yang digunakan di suatu tempat dalam perhitungan Dunnett?
- Apakah variasi kecil ini setiap kali sebenarnya merupakan masalah?
sumber
Anda benar, ada generasi bilangan acak yang terlibat, dan itu membuat kalkulasi bervariasi dari run-to-run. Pelakunya sebenarnya bukan prosedur Dunnett, tetapi distribusi t multivariat yang diperlukan untuk penyesuaian satu langkah.
Kode berikut menunjukkan contoh penghitunganP( X< 0 ) dengan vektor 5 dimensi X memiliki multivariat T5 distribusi dengan korelasi yang dapat ditukar:
Jika ini yang menjadi perhatian, panggil saja
set.seed
dengan argumen apa pun sebelum perhitungan untuk membuatnya benar-benar dapat diproduksi kembali.Omong-omong, ada pengakuan dan kuantifikasi kesalahan dalam output dari
glht
:sumber