Apakah "boleh" untuk menambahkan garis vertikal ke histogram untuk memvisualisasikan nilai rata-rata?
Sepertinya tidak apa-apa bagi saya, tetapi saya belum pernah melihat ini di buku pelajaran dan sejenisnya, jadi saya bertanya-tanya apakah ada semacam konvensi untuk tidak melakukan itu?
Grafik ini untuk makalah, saya hanya ingin memastikan saya tidak sengaja melanggar beberapa aturan statistik tak terucapkan yang sangat penting. :)
Jawaban:
Tentu saja, mengapa tidak?
Ini sebuah contoh (satu dari belasan yang saya temukan dengan pencarian google sederhana):
(Sumber gambar adalah blog kegunaan mengukur, di sini .)
Saya telah melihat cara, berarti plus atau minus deviasi standar, berbagai kuantil (seperti median, kuartil, persentil ke-10 dan ke-90) semuanya ditampilkan dalam berbagai cara.
Alih-alih menggambar garis tepat di seberang plot, Anda dapat menandai informasi di bagian bawahnya - seperti:
Ada contoh (salah satu dari banyak yang dapat ditemukan) dengan sebuah kotak di atas, bukan di bawah, di sini .
Terkadang orang menandai data:
(Saya sedikit gugup lokasi data karena nilainya dibulatkan menjadi bilangan bulat dan Anda tidak dapat melihat kerapatan relatif dengan baik.)
Ada contoh semacam ini, dilakukan di Stata, di halaman ini (lihat yang ketiga di sini )
Histogram lebih baik dengan sedikit informasi tambahan - mereka bisa menyesatkan sendiri
Anda hanya perlu berhati-hati untuk menjelaskan dari apa plot Anda! (Anda ingin judul dan label sumbu x lebih baik daripada yang saya gunakan di sini, sebagai permulaan. Ditambah penjelasan dalam keterangan gambar yang menjelaskan apa yang telah Anda tandai di atasnya.)
-
Satu plot terakhir:
-
Plot saya dihasilkan dalam R.
Edit:
Sebagai @gung menduga,
abline(v=mean...
digunakan untuk menggambar garis-mean di plot danrug
digunakan untuk menggambar nilai data (meskipun saya benar-benar digunakanrug(jitter(...
karena data itu dibulatkan menjadi bilangan bulat).Inilah cara untuk melakukan boxplot di antara histogram dan sumbu:
Saya tidak akan mencantumkan apa yang ada untuk semua, tetapi Anda dapat memeriksa argumen dalam bantuan (
?boxplot
) untuk mencari tahu untuk apa mereka, dan bermain dengan mereka sendiri.Namun, ini bukan solusi umum - saya tidak menjamin itu akan selalu berfungsi sebaik di sini (perhatikan saya sudah mengubah
at
danboxwex
opsi *). Jika Anda tidak menulis fungsi cerdas untuk mengurus semuanya, perlu memperhatikan apa yang dilakukan semuanya untuk memastikan itu melakukan apa yang Anda inginkan.Inilah cara membuat data yang saya gunakan (saya mencoba menunjukkan bagaimana regresi Theil benar-benar mampu menangani beberapa pencilan berpengaruh). Kebetulan itu adalah data yang saya mainkan ketika saya pertama kali menjawab pertanyaan ini.
* - nilai yang sesuai
at
adalah sekitar -0,5 kali dari nilaiboxwex
; itu akan menjadi standar yang baik jika Anda menulis fungsi untuk melakukannya;boxwex
perlu ditingkatkan dengan cara yang berhubungan dengan skala-y (tinggi) dari plot kotak; Saya menyarankan 0,04 hingga 0,05 kali batas atas y mungkin sering baik-baik saja.Kode untuk stripchart marginal:
sumber
abline(v=mean(Davis2[,2]))
&rug(Davis2[,2])
Saya kira, tapi bagaimana Anda mengganjal kotak di sana?boxplot
fungsi. Antaraboxplot
danboxp
Anda dapat melakukan beberapa hal yang agak bagus dengan sedikit usaha.at
danboxwex
seterusnya ... tetapi yang terbaik saya hanya melakukan beberapa plot seperti itu setahun, dan dibutuhkan beberapa detik setiap kali untuk mengetik? Boxplot dan mengatur opsi yang tepat. Saya pikir lebih mudah untuk hanya memperhatikan apa yang saya lakukan.Tentu saja Anda bisa. Pastikan untuk memberi label dengan jelas / menunjukkan apa artinya garis, dan menghindari membuat plot terlalu 'sibuk'.
Tidak ada yang lebih buruk daripada grafik yang menyampaikan terlalu banyak informasi sehingga mudah dimengerti. Tabel ini adalah cara yang sering diabaikan untuk menampilkan statistik ringkasan dalam masalah yang jelas dan singkat.
sumber
Jawaban sebelumnya memberikan poin yang sangat baik, tetapi ini adalah salah satu yang mendasar untuk ditambahkan.
Mean adalah pusat gravitasi dari suatu distribusi dan juga titik pivot dari histogram. Di sinilah distribusi akan seimbang. Jadi, ada hubungan timbal balik: tidak hanya dapat membantu Anda berpikir tentang histogram, juga histogram dapat membantu Anda berpikir tentang rata-rata. Ini bahkan mungkin lebih bermanfaat ketika distribusi miring dan rata-rata distribusi belum tentu di tengah.
sumber
Saya melihat tidak ada masalah dengan itu, lihat ini , ini , dan ini sebagai contoh.
sumber