Saya bingung tentang asumsi normalitas dalam tindakan berulang ANOVA. Secara khusus, saya bertanya-tanya normalitas seperti apa yang harus dipenuhi. Dalam membaca literatur dan jawaban pada CV, saya menemukan tiga kata berbeda dari asumsi ini.
Variabel dependen dalam setiap kondisi (berulang) harus didistribusikan secara normal.
Sering dinyatakan bahwa rANOVA memiliki asumsi yang sama dengan ANOVA, plus kebulatannya. Itulah klaim dalam statistik Penemuan Lapangan serta dalam artikel Wikipedia tentang subjek dan teks Lowry .
Sisa (perbedaan antara semua pasangan yang mungkin?) Harus didistribusikan secara normal.
Saya menemukan pernyataan ini dalam berbagai jawaban di CV ( 1 , 2 ). Dengan analogi rANOVA dengan uji-t berpasangan , ini mungkin juga tampak intuitif.
Normalitas multivariat harus dipenuhi.
Wikipedia dan sumber ini menyebutkan ini. Juga, saya tahu bahwa rANOVA dapat ditukar dengan MANOVA, yang mungkin layak untuk klaim ini.
Apakah ini setara? Saya tahu bahwa normalitas multivariat berarti bahwa setiap kombinasi linear dari DV terdistribusi secara normal, maka 3. akan secara alami menyertakan 2. jika saya memahami yang terakhir dengan benar.
Jika ini tidak sama, yang merupakan asumsi "benar" dari rANOVA? Bisakah Anda memberikan referensi?
Menurut saya ada sebagian besar dukungan untuk klaim pertama. Namun, ini tidak sejalan dengan jawaban yang biasanya diberikan di sini.
Model campuran linier
Karena petunjuk @ utobi, saya sekarang mengerti bagaimana rANOVA dapat disajikan kembali sebagai model campuran linier. Secara khusus, untuk model bagaimana perubahan tekanan darah dengan waktu, saya akan model nilai yang diharapkan sebagai: di mana y i j adalah pengukuran tekanan darah, sebuah i darah rata-rata tekanan dari subjek ke- i , dan t i j saat ke- j waktu subjek ke- i diukur, b i
Akhirnya, saya mencoba memikirkan apa artinya ini bagi normalitas, tetapi hanya sedikit keberhasilan. Mengutip McCulloch dan Searle (2001, hlm. 35. Persamaan (2.14)):
Saya mengerti ini berarti itu
4. data masing-masing individu harus didistribusikan secara normal, tetapi ini tidak masuk akal untuk diuji dengan beberapa titik waktu.
Saya mengambil ungkapan ketiga yang berarti itu
5. rata-rata dari masing-masing mata pelajaran terdistribusi secara normal. Perhatikan bahwa ini adalah dua kemungkinan berbeda di atas tiga yang disebutkan di atas.
McCulloch, CE & Searle, SR (2001). Model umum, linier, dan campuran . New York: John Wiley & Sons, Inc.
Jawaban:
Ini adalah model ANOVA tindakan terulang yang paling sederhana jika kami memperlakukannya sebagai model univariat:
We do not need to make distributional assumptions aboutai , as they can go into the model as fixed effects, dummy variables (contrary to what we do with linear mixed models). Same happens for the time dummies. For this model, you simply regress the outcome in long form against the person dummies and the time dummies. The effect of interest is the time dummies, the F -test that tests the null hypothesis that b1=...=bt=0 is the major test in the univariate repeated measures ANOVA.
What are the required assumptions for theF -test to behave appropriately? The one relevant to your question is:
There are additional (more consequential) assumptions for theF -test to be valid, as one can see that the data are not independent of each other since the individuals repeat across rows.
If you want to treat the repeated measures ANOVA as a multivariate model, the normality assumptions may be different, and I cannot expand on them beyond what you and I have seen on Wikipedia.
sumber
The explanation of normality of repeated-measure ANOVA can be found here:
Understanding repeated measure ANOVA assumptions for correct interpretation of SPSS output
You need normality of the dependent variables in residuals (this implies a normal distribution in all groups, with common variance and group-dependent average), as in regression.3→1 ). However, I'm not convinced this implies normality of residuals (3→2 ), given residuals are determined by independent variables (groups, in ANOVA) as well. I agree with you for point 5 : you are basically talking about an individual-level random effect having a normal distribution.
As you noticed, multivariate normality implies that all linear combinations of the dependent variables are normally distributed, so it is a stronger concept than normality of single variables (
sumber