Saya ingin belajar ANOVA. Sebelum saya mulai mempelajari bagaimana algoritme bekerja (perhitungan apa yang harus dilakukan) dan mengapa itu bekerja, pertama-tama saya ingin tahu masalah apa yang sebenarnya kami selesaikan dengan ANOVA, atau jawaban apa yang kami coba jawab. Dengan kata lain: Apa input dan apa output dari algoritma?
Saya mengerti apa yang kami gunakan sebagai input. Kami memiliki serangkaian angka. Setiap angka dilengkapi dengan nilai-nilai dari satu atau lebih variabel kategori (juga dikenal sebagai "faktor"). Sebagai contoh:
+------------+------------+-------+
| factor 1 | factor 2 | value |
+------------+------------+-------+
| "A" | "a" | 1.0 |
| "A" | "a" | 2.4 |
| "A" | "b" | 0.3 |
| "A" | "b" | 7.4 |
| "B" | "a" | 1.2 |
| "B" | "a" | 8.4 |
| "B" | "b" | 0.4 |
| "B" | "b" | 7.2 |
+------------+------------+-------+
Apakah benar mengatakan bahwa ANOVA menghitung nilai-p dari hipotesis nol yang menyatakan bahwa tidak ada pengaruh faktor-faktor terhadap nilai rata-rata dari nilai-nilai itu? Dengan kata lain, kami memberikan data yang diberikan di atas ke algoritma dan sebagai hasilnya kami mendapatkan nilai p dari hipotesis nol?
Jika demikian, ukuran apa yang sebenarnya kita gunakan untuk menghitung nilai-p. Misalnya kita dapat mengatakan bahwa, dengan hipotesis nol M dapat setinggi yang diamati (atau bahkan lebih tinggi) hanya secara kebetulan dalam 1% kasus. Apa itu M?
Bukankah kita juga menyelidiki faktor-faktor dalam ANOVA secara terpisah? Bisakah ANOVA mengatakan bahwa factor_1 memiliki efek tetapi factor_2 tidak? Dapatkah ANOVA mengatakan, bahwa untuk nilai faktor tertentu yang sesuai dengan nilai "A", "B" dan "C" secara statistik tidak dapat dibedakan (memiliki rata-rata yang sama, misalnya) tetapi nilai "D" berpengaruh?