Bagaimana cara memvisualisasikan apa yang dilakukan ANOVA?

60

Cara apa (cara?) Yang ada untuk menjelaskan secara visual apa itu ANOVA?

Setiap referensi, tautan (paket R?) Akan disambut.

Tal Galili
sumber
Dalam blognya, 'Upaya psikolog dalam pemrograman statistik', Kristoffer Magnusson memberikan contoh yang bagus tentang visualisasi anova satu arah menggunakan D3.js rpsychologist.com/d3-one-way-anova/#comment-1891
Epifunky
Saya telah menemukan visualisasi yang bagus tentang analisis varian. Ini tidak setepat jawaban sebelumnya, tetapi Anda dapat bermain interaktif dengan visualisasi. Menemukannya cukup menarik: students.brown.edu/seeing-theory/regress/index.html#third
Mike

Jawaban:

51

Secara pribadi, saya suka memperkenalkan regresi linier dan ANOVA dengan menunjukkan bahwa semuanya sama dan model linier berjumlah untuk mempartisi total varians: Kami memiliki beberapa jenis varians dalam hasil yang dapat dijelaskan oleh faktor-faktor yang menarik, ditambah yang tidak dapat dijelaskan. bagian (disebut 'residual'). Saya biasanya menggunakan ilustrasi berikut (garis abu-abu untuk variabilitas total, garis hitam untuk variabilitas kelompok atau individu):

teks alternatif

Saya juga menyukai heplots paket R, dari Michael ramah dan John Fox, tapi lihat juga Pengujian Hipotesis Visual di Model multivariat Linear: The heplots Paket untuk R .

Cara standar untuk menjelaskan apa yang sebenarnya dilakukan ANOVA, terutama dalam kerangka Model Linier, dijelaskan dengan sangat baik dalam jawaban Plane untuk pertanyaan kompleks , oleh Christensen, tetapi ada sangat sedikit ilustrasi. Metode Statistik Saville dan Wood : Pendekatan geometris memiliki beberapa contoh, tetapi terutama pada regresi. Dalam Desain dan Analisis Percobaan Montgomery , yang sebagian besar berfokus pada DoE, ada ilustrasi yang saya sukai, tetapi lihat di bawah

teks alternatif

(ini milik saya :-)

Tapi saya pikir Anda harus mencari buku teks di Linear Models jika Anda ingin melihat bagaimana jumlah kuadrat, kesalahan, dll. Diterjemahkan ke dalam ruang vektor, seperti yang ditunjukkan di Wikipedia . Estimasi dan Inferensi dalam Ekonometrika , oleh Davidson dan MacKinnon, tampaknya memiliki ilustrasi yang bagus (bab 1 sebenarnya mencakup geometri OLS) tetapi saya hanya menelusuri terjemahan bahasa Prancis (tersedia di sini ). Geometri Regresi Linier juga memiliki beberapa ilustrasi yang bagus.

Edit :

Ah, dan saya baru ingat artikel ini oleh Robert Pruzek, Grafik baru untuk ANOVA satu arah .

Edit 2

Dan sekarang, paket granova (disebutkan oleh @ gd047 dan terkait dengan kertas di atas) telah porting ke ggplot, lihat granovaGG dengan ilustrasi untuk ANOVA satu arah di bawah ini.

masukkan deskripsi gambar di sini

chl
sumber
Apakah ilustrasi pertama diproduksi menggunakan R?
George Dontas
@ gd047 Ya. Harus memiliki kode sumber yang buruk di suatu tempat jika Anda mau. Yang kedua dilakukan di Metapost.
chl
3
@ gd047 Baiklah, seperti biasa selalu ketika kita mencari kode lama yang tidak dapat kita temukan (terlepas dari usaha terbaik saya dengan grep / find), jadi saya menulis ulang skrip R yang cepat (masih jelek) untuk itu. Saya juga memberikan contoh kode MP .
chl
Sayangnya, geometri hubungan regresi linier telah membusuk.
Silverfish
23

Bagaimana dengan sesuatu yang seperti ini? teks alternatif

Mengikuti Crawley (2005). Statistik. Pengantar menggunakan R: Wiley.

EDI
sumber
1
(+1) Saya mengingatkan saya pada plot.design()(tetapi Anda dalam versi yang disempurnakan :-)
chl
Ini yang terbaik.
Penasaran
13

Terima kasih atas jawaban Anda sejauh ini. Ketika mereka berada di tempat yang sangat mencerahkan, saya merasa bahwa menggunakan mereka untuk kursus yang saya ajarkan saat ini (yah, TA'ing) akan terlalu banyak untuk siswa saya. (Saya membantu mengajar mata kuliah BioStatistik untuk siswa dari gelar lanjutan dalam ilmu kedokteran)

Oleh karena itu, saya akhirnya membuat dua gambar (Keduanya berbasis simulasi) yang saya pikir adalah contoh yang berguna untuk menjelaskan ANOVA.

Saya akan senang membaca komentar atau saran untuk memperbaikinya.

Gambar pertama menunjukkan simulasi 30 titik data, dipisahkan menjadi 3 plot (menunjukkan bagaimana MST = Var dipisahkan ke data yang membuat MSB dan MSW:

  • Plot kiri menunjukkan plot pencar data per grup.
  • Yang di tengah menunjukkan seperti apa data yang akan kita gunakan untuk MSB.
  • Gambar yang tepat menunjukkan bagaimana data yang akan kita gunakan untuk MSW terlihat.

teks alternatif

Gambar kedua menunjukkan 4 plot, masing-masing untuk kombinasi varians dan harapan yang berbeda untuk grup sementara

  • Baris pertama plot adalah untuk varian rendah, sedangkan baris kedua adalah untuk varian tinggi (er).
  • Kolom pertama plot adalah untuk harapan yang sama antara kelompok, sedangkan kolom kedua menunjukkan kelompok dengan harapan yang sangat berbeda.

teks alternatif

Tal Galili
sumber
2
(+1) Saya selalu berpikir bahwa pesan takeaway saat mengajar ANOVA adalah: (1) kami memiliki rasio-F yang mencerminkan kepentingan relatif dari varians yang diperhitungkan oleh faktor minat kami. total variance (atau MSB / MSW di mana MSW = MST-MSB), (2) perbedaan antara rata-rata grup adalah varians, dan (3) kami secara eksplisit menguji vs . ( ). Jika Anda dapat menyampaikan ide-ide itu ke tampilan grafis - yang tampaknya menjadi masalah di sini--, maka saya pikir Anda hampir selesai. H0: μ1=μ2==μk H1:  i,j | μiμjH1¬ H0
chl
Hai chl, terima kasih atas umpan balik positif (dan untuk jawaban terinci Anda sebelumnya)! Saya pikir beberapa pijat dibawa pulang terbesar yang saya dapatkan dari menyiapkan bahan untuk kelas ini adalah: 1) Bagaimana menggambarkan transformasi data asli sehingga untuk mendapatkan ukuran varians MSB dan MSW. 2) Bagaimana statistik uji MSB / MSW sebenarnya adalah tes satu sisi (bukan dua sisi) di mana H0 adalah MSB <= MSW. Terakhir, saya hanya berpikir untuk mencatat bahwa memang benar bahwa SSW = SST-SSB (tapi saya tidak melihat bagaimana itu berlaku untuk MSW = MST-MSB).
Tal Galili
1
Yap, maaf saya cepat aja. Maksud saya: Pertimbangkan model atau dan sorot secara grafik dekomposisi berikut: , itu berlaku. dinyatakan sebagai penyimpangan dari mean rata-rata + rata-rata grup + fluktuasi di sekitar rata-rata grup. Kemudian, kita memiliki atau total variasi = antara Variasi -group + variasi dalam-grup (yang pada dasarnya adalah gambar pertama Anda). yij=μ+αi+εijyij=μi+εijyij=yi¯+εij=y¯+(y¯iy¯)+(yijy¯i)(yijy¯)=(y¯iy¯)+(yijy¯i)
chl
12

Karena kami mengumpulkan beberapa jenis grafik bagus di pos ini, berikut ini adalah grafik lain yang baru-baru ini saya temukan dan dapat membantu Anda memahami cara kerja ANOVA dan bagaimana statistik F dihasilkan. Grafik dibuat menggunakan paket granova di R. teks alternatif

George Dontas
sumber
2
(+1) Saya memberi tautan ke artikel Robert Pruzek, tetapi saya tidak tahu itu tersedia di R.
chl
10

Lihatlah presentasi Hadley Wickham ( pdf , mirror ) di ggplot. Mulai dari halaman 23-40 dari dokumen ini ia menjelaskan pendekatan yang menarik untuk memvisualisasikan ANOVA.

* Tautan diambil dari: http://had.co.nz/ggplot2/

Dimitry L
sumber
6

Pertanyaan bagus Anda tahu, saya telah berjuang sendiri dengan membungkus kepala saya di sekitar ANOVA untuk waktu yang sangat lama. Saya selalu menemukan diri saya kembali ke intuisi "antara versus dalam", dan saya selalu mencoba membayangkan seperti apa ini di kepala saya. Saya senang pertanyaan ini muncul, dan saya kagum dengan beragam pendekatan dalam jawaban di atas.

Bagaimanapun, untuk waktu yang lama (bertahun-tahun, bahkan) saya ingin mengumpulkan beberapa plot di satu tempat di mana saya dapat melihat apa yang terjadi secara bersamaan dari banyak arah yang berbeda: 1) seberapa jauh jarak populasi , 2) berapa terpisah jauh datanya , 3) seberapa besar antara dibandingkan dengan di dalam , dan 4) bagaimana distribusi F pusat versus noncentral dibandingkan?

Di dunia yang benar - benar hebat , saya bahkan bisa bermain dengan slider untuk melihat bagaimana ukuran sampel mengubah banyak hal.

Jadi saya sudah bermain dengan manipulateperintah di RStudio , dan sapi suci, itu berhasil! Ini adalah salah satu plotnya, sebuah snapshot, sungguh:

memvisualisasikan ANOVA

Jika Anda memiliki RStudio, Anda bisa mendapatkan kode untuk membuat plot di atas (slider dan semuanya)! di Github di sini .

Setelah bermain dengan ini untuk sementara, saya terkejut melihat seberapa baik statistik F membedakan kelompok, bahkan untuk ukuran sampel yang cukup kecil. Ketika saya melihat populasi, mereka benar-benar tidak jauh (mata saya), namun, bar "dalam" secara konsisten dikerdilkan oleh bar "antara". Belajar sesuatu setiap hari, kurasa.

kjetil b halvorsen
sumber
3

Untuk menggambarkan apa yang terjadi dengan ANOVA satu arah, saya kadang-kadang menggunakan applet yang ditawarkan oleh penulis "Pengantar Praktek Statistik", yang memungkinkan siswa untuk bermain dengan di dalam dan di antara varian dan mengamati efeknya pada statistik F . Inilah tautannya (applet adalah yang terakhir di halaman). Cuplikan layar contoh:

masukkan deskripsi gambar di sini

Pengguna mengontrol slider atas, memvariasikan penyebaran vertikal dari tiga kelompok data. Titik merah di bagian bawah bergerak di sepanjang plot nilai-p sementara statistik F yang ditunjukkan di bawah diperbarui.

David
sumber
2

Tampaknya kapal sudah berlayar dalam hal jawaban, tapi saya pikir jika ini adalah kursus pengantar bahwa sebagian besar pajangan yang ditawarkan di sini akan terlalu sulit untuk dipahami oleh siswa pengantar ... atau paling tidak terlalu sulit untuk dipahami tanpa tampilan pengantar yang menyediakan penjelasan yang sangat disederhanakan tentang varian partisi. Tunjukkan pada mereka bagaimana total SST meningkat dengan jumlah subjek. Kemudian setelah menunjukkan itu mengembang untuk beberapa mata pelajaran (mungkin menambahkan satu di setiap kelompok beberapa kali), jelaskan bahwa SST = SSB + SSW (meskipun saya lebih suka menyebutnya SSE dari awal karena itu menghindari kebingungan ketika Anda pergi ke dalam mata pelajaran tes IMO ). Kemudian perlihatkan kepada mereka representasi visual dari partisi varians, mis. Kode warna kotak besar sehingga Anda dapat melihat bagaimana SST dibuat dari SSB dan SSW. Kemudian,

russellpierce
sumber
2

YX

masukkan deskripsi gambar di sini

masukkan deskripsi gambar di sini

masukkan deskripsi gambar di sini

Martin Van der Linden
sumber