Baik plot kotak-dan-kumis dan grafik batang merupakan grafik yang sesuai untuk ANOVA menurut The R Book (Crawley, 2013), tetapi mana yang lebih tepat ? Saya kira itu tergantung situasi ... adakah yang bisa membantu saya?
boxplot
rule-of-thumb
barplot
Ladislav Naďo
sumber
sumber
Jawaban:
Khusus untuk ilustrasi grafis ANOVA:
Bagan kotak atau bagan batang jauh lebih baik daripada tidak sama sekali secara grafis untuk ANOVA, tetapi seperti yang umumnya diplotkan, keduanya tidak langsung atau tidak lengkap sebagai ringkasan grafis.
ANOVA adalah tentang perbandingan cara dalam konteks variasi satu atau lebih jenis, sehingga grafik yang paling tepat akan menunjukkan, minimal, berarti serta data mentah. Penyimpangan standar kelompok (SD) atau jumlah terkait tidak akan membahayakan.
Meskipun beberapa varietas plot kotak menunjukkan rata-rata serta median, jenis standar menunjukkan median, kuartil, dan beberapa informasi di bagian ujung distribusi. Varian yang paling umum tampaknya adalah di mana titik data individual ditunjukkan jika dan hanya jika mereka terletak lebih dari 1,5 IQR dari kuartil yang lebih dekat. Yaitu: rentang interkuartil IQR kuartil atas kuartil bawah, jadi plot sebagai nilai poin lebih besar dari kuartil atas 1,5 IQR atau kurang dari kuartil rendah= - + - 1,5 IQR. Konvensi semacam itu dapat membantu menunjukkan outlier kasar yang mungkin bermasalah untuk ANOVA, tetapi median atau kuartil tidak memainkan bagian apa pun dalam ANOVA dan apakah median perkiraan rata-rata adalah suatu titik untuk diperiksa, tidak diasumsikan. Secara umum, analis data yang berpengalaman mengambil misalkan ditandai outlier dan / atau asimetri distribusi sebagai tanda masalah yang perlu tindakan, seperti transformasi data atau kebutuhan untuk model linier umum dengan fungsi tautan non-identitas. Namun demikian, mengejutkan bahwa berapa banyak buku teks dan akun lainnya menunjukkan plot kotak ketika ANOVA disajikan tetapi tidak menyebutkan gajah tidak di dalam ruangan, cara yang tidak diplot.
Sebaliknya, jenis bagan batang yang paling umum dalam konteks ini merangkum data dengan cara dan SD atau kesalahan standar, tetapi menghilangkan tampilan setiap titik data individu sebaliknya. Jadi, misalnya, outlier atau asimetri yang ditandai hanya dapat disimpulkan dari out-of-line atau peningkatan variabilitas dalam kelompok individu.
Secara umum, ada banyak saran yang jenis grafik mana yang bermanfaat tetapi sedikit konsensus tentang mana yang terbaik. Saya menyarankan sebagai kriteria yang ditunjukkan grafik yang bagus
Pola variasi lengkap dalam data, setidaknya sebagai latar belakang atau konteks
Ringkasan data yang relevan, khususnya yang relevan dengan model yang dihibur atau deskriptor yang dipertimbangkan
Indikasi kemungkinan masalah dengan data yang meragukan asumsi yang dibuat.
Ada beberapa desain yang membantu dengan ANOVA, seperti plot titik atau strip dengan sarana tambahan dan SES.
Makalah ini oleh John Tukey menjelaskan perbedaan antara grafik propaganda dan grafik analitik yang relevan di sini. Terlalu banyak ilustrasi grafis ANOVA adalah grafik propaganda (lihat! Kelompok-kelompok itu sangat berbeda) tanpa banyak analisis (dan apa lagi yang bisa kita pelajari tentang data atau keterbatasan teknik dalam aplikasi ini?).
sumber
Tolong jangan bingung antara grafik batang (satu balok digunakan untuk menunjukkan setiap jumlah bunga) dan plot dinamit (satu balok menunjukkan rata-rata setiap kelompok, ditambah balok kesalahan). Plot dinamit TIDAK PERNAH diterima karena menyembunyikan distribusi data tanpa alasan sama sekali.
Ya saya menyadari bahwa ini adalah tipe plot yang paling umum. Ini adalah masalah besar yang mencerminkan kepentingan (rendah) yang peneliti tempat pada bentuk data mereka. Jika Anda seorang detektif yang mencari senjata pembunuh, apakah lebih baik jika seorang saksi memberi tahu Anda 1) hanya lokasi dan ukuran senjata itu? atau 2) lokasi, ukuran, dan bentuk?
http://biostat.mc.vanderbilt.edu/wiki/pub/Main/TatsukiRcode/Poster3.pdf
sumber