Saat memplot boxplot dengan python matplotblib, garis di tengah plot adalah median distribusi.
Apakah ada kemungkinan untuk memiliki garis rata-rata sebagai gantinya. Atau memplotnya di sebelahnya dengan gaya yang berbeda.
Juga, karena garis median adalah median, apakah itu akan membingungkan pembaca saya jika saya menjadikannya rata-rata (tentu saja saya akan menambahkan catatan apa garis tengahnya)?
data-visualization
python
matplotlib
boxplot
Peter Smit
sumber
sumber
Untuk menjawab pertanyaan kedua Anda: Ya, saya pikir itu akan membingungkan untuk menempatkan garis pada mean daripada median. Aturan yang tepat mengendalikan panjang 'kumis' (jika ada) dan perawatan outlier bervariasi, tetapi semua orang tetap menggunakan kotak Tukey sebagai menampilkan median dan kuartil atas dan bawah. Untuk distribusi dengan kemiringan sangat tinggi, mean bisa berada di luar kotak, yang akan terlihat sangat aneh. Penggunaan umum adalah bahwa median sesuai dengan rentang interkuartil, sedangkan rata-rata berlaku dengan standar deviasi (atau kesalahan standar rata-rata jika Anda tertarik pada inferensi daripada deskripsi data). Jika Anda ingin menunjukkan mean secara visual, saya akan menggunakan simbol yang berbeda untuk menampilkannya untuk menghindari kebingungan.
sumber