Saya perlu menjelaskan intuisi di balik apa yang dilakukan ANOVA kepada orang non-teknis. Apakah ada visual yang menjelaskan ide itu? Visual yang menggambarkan ide kunci dalam konteks ANOVA satu arah dengan level 3 faktor mungkin mungkin membantu?
Mari kita anggap bahwa orang tersebut telah mengambil beberapa kursus statistik sebagai siswa di masa lalu tetapi telah melupakan detail bahkan melakukan tes-z. Namun, dia ingat bahwa pengujian hipotesis digunakan untuk memeriksa apakah efek yang diamati adalah karena kesempatan acak atau karena perubahan nyata dalam parameter bunga.
Jawaban:
ANOVA adalah teknik statistik yang digunakan untuk menentukan apakah klasifikasi data tertentu berguna dalam memahami variasi hasil. Pikirkan tentang membagi orang ke dalam ember atau kelas berdasarkan beberapa kriteria, seperti pinggiran kota dan tempat tinggal perkotaan. Variasi total dalam variabel dependen (hasil yang Anda pedulikan, seperti responsif terhadap kampanye iklan) dapat didekomposisi menjadi variasi antara kelas dan variasi dalamkelas. Ketika variasi di dalam kelas relatif kecil dibandingkan dengan variasi di antara kelas, skema klasifikasi Anda dalam arti tertentu atau berguna untuk memahami dunia. Anggota dari masing-masing cluster berperilaku serupa satu sama lain, tetapi orang-orang dari kelompok yang berbeda berperilaku berbeda. Dekomposisi ini digunakan untuk membuat uji F formal dari hipotesis ini.
sumber
Saya menemukan buku online David Lane sangat berguna.
Dengan cara yang lebih mendasar, ada makalah yang diundang dalam Annals of Statistics oleh TP Speed yang disebut "What is Analysis of Variance?". Butuh beberapa upaya, tetapi pada akhirnya itu sangat informatif. Inti dari makalah ini adalah untuk menunjukkan bahwa ANOVA hanyalah penguraian varian menjadi penjumlahan varian yang dimiliki kelompok yang lebih kecil. Pengambilan penting lainnya adalah Anda dapat menggunakan ANOVA untuk varian yang lebih umum (kovarian), yang menurut saya menarik.
sumber
Anda bisa menjelaskan bahwa ANOVA adalah dekomposisi data sebagai komponen yang sesuai dengan kelompok atau variabel atau sumber variasi yang berbeda . Contohnya adalah⎛⎝⎜⎜⎜⎜⎜⎜⎜⎜⎜8984818779887787928197928789809479858488⎞⎠⎟⎟⎟⎟⎟⎟⎟⎟⎟=⎛⎝⎜⎜⎜⎜⎜⎜⎜⎜⎜8686868686868686868686868686868686868686⎞⎠⎟⎟⎟⎟⎟⎟⎟⎟⎟+⎛⎝⎜⎜⎜⎜⎜⎜⎜⎜⎜- 6- 3- 1- 2- 4- 6- 3- 1- 2- 4- 6- 3- 1- 2- 4- 6- 3- 1- 2- 4⎞⎠⎟⎟⎟⎟⎟⎟⎟⎟⎟+⎛⎝⎜⎜⎜⎜⎜⎜⎜⎜⎜- 2- 2- 2- 2- 2- 1- 1- 1- 1- 13333300000⎞⎠⎟⎟⎟⎟⎟⎟⎟⎟⎟+⎛⎝⎜⎜⎜⎜⎜⎜⎜⎜⎜- 1- 3- 2- 1- 1- 3- 5- 3- 5- 0- 2- 6- 1- 2- 5- 2- 4- 0- 4- 6⎞⎠⎟⎟⎟⎟⎟⎟⎟⎟⎟ yt i= μ +βsaya+τt+ϵt i dan dekomposisi data terkait dihitung sebagai
yt i=y¯+ {y¯saya-y¯} + {y¯t-y¯} + {yt i-y¯saya-y¯t+y¯} .
Untuk ANOVA satu arah, contohnya adalah
⎛⎝⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜626063596367716465666866716768685662606163646359⎞⎠⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟=⎛⎝⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜646464646464646464646464646464646464646464646464⎞⎠⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟+⎛⎝⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜- 3- 3- 3- 3222222444444-3-3-3-3-3-3-3- 3⎞⎠⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟+⎛⎝⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜- 1- 1- 2- 2- 3- 1- 5- 2- 1- 0- 0- 2- 3- 1- 0- 0- 5- 1- 1- 0- 2- 3- 2- 2⎞⎠⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟ dan aljabar dapat ditulis dengan cara yang sama.
yang mewakili pengamatan dari desain ANOVA dua arah (tanpa repliasi), dengan baris dan kolom sebagai dua kelompok. Model aljabar adalah
Ini sebagian besar komentar, karena itu bukan penjelasan lengkap, tetapi bisa menjadi komponen yang bermanfaat dari penjelasan apa pun, dan dapat disesuaikan dengan tingkat yang diperlukan. Tabel seperti itu banyak digunakan dalam buku terkenal ini .
sumber