Cara apa (cara?) Yang ada untuk menjelaskan secara visual apa itu ANOVA?
Setiap referensi, tautan (paket R?) Akan disambut.
data-visualization
anova
teaching
Tal Galili
sumber
sumber
Jawaban:
Secara pribadi, saya suka memperkenalkan regresi linier dan ANOVA dengan menunjukkan bahwa semuanya sama dan model linier berjumlah untuk mempartisi total varians: Kami memiliki beberapa jenis varians dalam hasil yang dapat dijelaskan oleh faktor-faktor yang menarik, ditambah yang tidak dapat dijelaskan. bagian (disebut 'residual'). Saya biasanya menggunakan ilustrasi berikut (garis abu-abu untuk variabilitas total, garis hitam untuk variabilitas kelompok atau individu):
Saya juga menyukai heplots paket R, dari Michael ramah dan John Fox, tapi lihat juga Pengujian Hipotesis Visual di Model multivariat Linear: The heplots Paket untuk R .
Cara standar untuk menjelaskan apa yang sebenarnya dilakukan ANOVA, terutama dalam kerangka Model Linier, dijelaskan dengan sangat baik dalam jawaban Plane untuk pertanyaan kompleks , oleh Christensen, tetapi ada sangat sedikit ilustrasi. Metode Statistik Saville dan Wood : Pendekatan geometris memiliki beberapa contoh, tetapi terutama pada regresi. Dalam Desain dan Analisis Percobaan Montgomery , yang sebagian besar berfokus pada DoE, ada ilustrasi yang saya sukai, tetapi lihat di bawah
(ini milik saya :-)
Tapi saya pikir Anda harus mencari buku teks di Linear Models jika Anda ingin melihat bagaimana jumlah kuadrat, kesalahan, dll. Diterjemahkan ke dalam ruang vektor, seperti yang ditunjukkan di Wikipedia . Estimasi dan Inferensi dalam Ekonometrika , oleh Davidson dan MacKinnon, tampaknya memiliki ilustrasi yang bagus (bab 1 sebenarnya mencakup geometri OLS) tetapi saya hanya menelusuri terjemahan bahasa Prancis (tersedia di sini ). Geometri Regresi Linier juga memiliki beberapa ilustrasi yang bagus.
Edit :
Ah, dan saya baru ingat artikel ini oleh Robert Pruzek, Grafik baru untuk ANOVA satu arah .
Edit 2
Dan sekarang, paket granova (disebutkan oleh @ gd047 dan terkait dengan kertas di atas) telah porting ke ggplot, lihat granovaGG dengan ilustrasi untuk ANOVA satu arah di bawah ini.
sumber
Bagaimana dengan sesuatu yang seperti ini?
Mengikuti Crawley (2005). Statistik. Pengantar menggunakan R: Wiley.
sumber
plot.design()
(tetapi Anda dalam versi yang disempurnakan :-)Terima kasih atas jawaban Anda sejauh ini. Ketika mereka berada di tempat yang sangat mencerahkan, saya merasa bahwa menggunakan mereka untuk kursus yang saya ajarkan saat ini (yah, TA'ing) akan terlalu banyak untuk siswa saya. (Saya membantu mengajar mata kuliah BioStatistik untuk siswa dari gelar lanjutan dalam ilmu kedokteran)
Oleh karena itu, saya akhirnya membuat dua gambar (Keduanya berbasis simulasi) yang saya pikir adalah contoh yang berguna untuk menjelaskan ANOVA.
Saya akan senang membaca komentar atau saran untuk memperbaikinya.
Gambar pertama menunjukkan simulasi 30 titik data, dipisahkan menjadi 3 plot (menunjukkan bagaimana MST = Var dipisahkan ke data yang membuat MSB dan MSW:
Gambar kedua menunjukkan 4 plot, masing-masing untuk kombinasi varians dan harapan yang berbeda untuk grup sementara
sumber
Karena kami mengumpulkan beberapa jenis grafik bagus di pos ini, berikut ini adalah grafik lain yang baru-baru ini saya temukan dan dapat membantu Anda memahami cara kerja ANOVA dan bagaimana statistik F dihasilkan. Grafik dibuat menggunakan paket granova di R.
sumber
Lihatlah presentasi Hadley Wickham ( pdf , mirror ) di ggplot. Mulai dari halaman 23-40 dari dokumen ini ia menjelaskan pendekatan yang menarik untuk memvisualisasikan ANOVA.
* Tautan diambil dari: http://had.co.nz/ggplot2/
sumber
Pertanyaan bagus Anda tahu, saya telah berjuang sendiri dengan membungkus kepala saya di sekitar ANOVA untuk waktu yang sangat lama. Saya selalu menemukan diri saya kembali ke intuisi "antara versus dalam", dan saya selalu mencoba membayangkan seperti apa ini di kepala saya. Saya senang pertanyaan ini muncul, dan saya kagum dengan beragam pendekatan dalam jawaban di atas.
Bagaimanapun, untuk waktu yang lama (bertahun-tahun, bahkan) saya ingin mengumpulkan beberapa plot di satu tempat di mana saya dapat melihat apa yang terjadi secara bersamaan dari banyak arah yang berbeda: 1) seberapa jauh jarak populasi , 2) berapa terpisah jauh datanya , 3) seberapa besar antara dibandingkan dengan di dalam , dan 4) bagaimana distribusi F pusat versus noncentral dibandingkan?
Di dunia yang benar - benar hebat , saya bahkan bisa bermain dengan slider untuk melihat bagaimana ukuran sampel mengubah banyak hal.
Jadi saya sudah bermain dengan
manipulate
perintah di RStudio , dan sapi suci, itu berhasil! Ini adalah salah satu plotnya, sebuah snapshot, sungguh:Jika Anda memiliki RStudio, Anda bisa mendapatkan kode untuk membuat plot di atas (slider dan semuanya)! di Github di sini .
Setelah bermain dengan ini untuk sementara, saya terkejut melihat seberapa baik statistik F membedakan kelompok, bahkan untuk ukuran sampel yang cukup kecil. Ketika saya melihat populasi, mereka benar-benar tidak jauh (mata saya), namun, bar "dalam" secara konsisten dikerdilkan oleh bar "antara". Belajar sesuatu setiap hari, kurasa.
sumber
Untuk menggambarkan apa yang terjadi dengan ANOVA satu arah, saya kadang-kadang menggunakan applet yang ditawarkan oleh penulis "Pengantar Praktek Statistik", yang memungkinkan siswa untuk bermain dengan di dalam dan di antara varian dan mengamati efeknya pada statistik F . Inilah tautannya (applet adalah yang terakhir di halaman). Cuplikan layar contoh:
Pengguna mengontrol slider atas, memvariasikan penyebaran vertikal dari tiga kelompok data. Titik merah di bagian bawah bergerak di sepanjang plot nilai-p sementara statistik F yang ditunjukkan di bawah diperbarui.
sumber
Tampaknya kapal sudah berlayar dalam hal jawaban, tapi saya pikir jika ini adalah kursus pengantar bahwa sebagian besar pajangan yang ditawarkan di sini akan terlalu sulit untuk dipahami oleh siswa pengantar ... atau paling tidak terlalu sulit untuk dipahami tanpa tampilan pengantar yang menyediakan penjelasan yang sangat disederhanakan tentang varian partisi. Tunjukkan pada mereka bagaimana total SST meningkat dengan jumlah subjek. Kemudian setelah menunjukkan itu mengembang untuk beberapa mata pelajaran (mungkin menambahkan satu di setiap kelompok beberapa kali), jelaskan bahwa SST = SSB + SSW (meskipun saya lebih suka menyebutnya SSE dari awal karena itu menghindari kebingungan ketika Anda pergi ke dalam mata pelajaran tes IMO ). Kemudian perlihatkan kepada mereka representasi visual dari partisi varians, mis. Kode warna kotak besar sehingga Anda dapat melihat bagaimana SST dibuat dari SSB dan SSW. Kemudian,
sumber
sumber