Saya yakin saya sudah membungkus ini sepenuhnya di kepala saya, tetapi saya tidak bisa memahaminya.
Uji-t membandingkan dua distribusi normal menggunakan distribusi Z. Itu sebabnya ada asumsi normalitas dalam DATA.
ANOVA setara dengan regresi linier dengan variabel dummy, dan menggunakan jumlah kuadrat, sama seperti OLS. Itu sebabnya ada asumsi normalitas RESIDUAL.
Butuh beberapa tahun, tapi saya pikir saya akhirnya memahami fakta-fakta dasar itu. Jadi mengapa uji-t setara dengan ANOVA dengan dua kelompok? Bagaimana mereka bisa setara jika mereka bahkan tidak menganggap hal yang sama tentang data?
distributions
regression
normality-assumption
t-test
anova
Chris Beeley
sumber
sumber
Jawaban:
Uji-t dengan dua kelompok mengasumsikan bahwa masing-masing kelompok terdistribusi normal dengan varians yang sama (walaupun cara mungkin berbeda di bawah hipotesis alternatif). Itu setara dengan regresi dengan variabel dummy karena regresi memungkinkan rata-rata setiap kelompok berbeda tetapi tidak varians. Karenanya residual (sama dengan data dengan kelompok berarti dikurangi) memiliki distribusi yang sama --- yaitu, mereka biasanya didistribusikan dengan rata-rata nol.
Uji-t dengan varian yang tidak sama tidak sama dengan ANOVA satu arah.
sumber
Uji-t hanyalah kasus khusus uji-F di mana hanya dua kelompok yang dibandingkan. Hasil dari keduanya akan persis sama dalam hal nilai-p dan ada hubungan sederhana antara statistik F dan t juga. F = t ^ 2. Kedua tes ini setara secara aljabar dan asumsi mereka sama.
Bahkan, persamaan ini meluas ke seluruh kelas ANOVA, uji-t, dan model regresi linier. Uji-t adalah kasus khusus ANOVA. ANOVA adalah kasus regresi khusus. Semua prosedur ini dimasukkan dalam Model Linier Umum dan memiliki asumsi yang sama.
Anda mungkin menganggapnya sebagai normalitas dalam data, tetapi Anda memeriksa normalitas di setiap grup - yang sebenarnya sama dengan memeriksa normalitas dalam residu ketika satu-satunya prediktor dalam model adalah indikator grup. Begitu juga dengan varian yang sama.
Selain itu, R tidak memiliki rutinitas terpisah untuk ANOVA. Fungsi anova dalam R hanyalah pembungkus untuk fungsi lm () - hal yang sama yang digunakan agar sesuai dengan model regresi linier - dikemas sedikit berbeda untuk memberikan apa yang biasanya ditemukan dalam ringkasan ANOVA daripada ringkasan regresi.
sumber
lm()
, kecuali Anda pindah ke model campuran dengan paketnlme
ataulme4
, tetapi ada cara praktis untuk menangani pengukuran berulang melalui spesifikasiError
istilah yang sesuai diaov()
, lihat rincian lebih lanjut tentang tutorial Baron & Li, §6.9, j.mp/ c5ME4uaov()
dibangun di ataslm()
fungsi tetapi termasuk argumen tambahan , seperti istilah khusus , sepertiError
.Saya setuju sepenuhnya dengan jawaban Rob, tetapi izinkan saya mengatakannya dengan cara lain (menggunakan wikipedia):
Asumsi ANOVA :
Uji-t asumsi :
Oleh karena itu, saya akan membantah pertanyaan itu, karena mereka jelas memiliki asumsi yang sama (walaupun dalam urutan yang berbeda :-)).
sumber
Satu hal yang jelas yang diabaikan oleh semua orang: Dengan ANOVA Anda menguji nol bahwa rata-rata identik terlepas dari nilai variabel penjelas Anda. Dengan Uji-T Anda juga dapat menguji kasing satu sisi, bahwa rerata lebih khusus diberikan satu nilai dari variabel penjelas Anda dari pada yang lain.
sumber
Saya akan lebih suka menggunakan uji-t untuk membandingkan dua kelompok dan akan menggunakan ANOVA untuk lebih dari 2 kelompok, karena alasan. Alasan penting adalah asumsi varian yang sama.
sumber