Saya memiliki kumpulan data kecil 14 kali terpisah untuk menyelesaikan tugas. Namun saya mengalami kesulitan menemukan grafik yang sesuai untuk digunakan untuk membuat grafik data. Jika sampel lebih besar saya akan menggunakan plot kotak atau histogram tetapi saya tidak yakin apakah itu akan sesuai untuk digunakan dalam kasus ini ketika sampel sangat kecil.
Pembaruan: Waktunya adalah 5,2,3,9,5,6,4,2,3,8,4,1,6,0,5,6,4,4,4,5,4,9,4,5,4,9,4,2
Jawaban:
Saya pikir prinsip utama di sini adalah Anda dapat dan harus menunjukkan semua nilai individual. Sekalipun detailnya jelas tidak menarik atau bermanfaat, tidak ada alasan untuk tidak memperlihatkannya, atau mewajibkan pembaca untuk memecahkan kode (katakanlah) histogram di mana bilah mungkin mewakili hanya satu atau dua nilai.
Di sini saya menawarkan komposit kecil. Kiri atas adalah plot titik atau strip (setidaknya dua puluh nama lain telah digunakan untuk ide yang sama) disajikan secara horizontal dan kanan atas ide yang sama disajikan secara vertikal. Contoh dengan nilai yang sama dicocokkan dengan menumpuk.
Di bagian bawah adalah plot kotak-kuantil, dalam arti Parzen, di mana skala horizontal diam-diam adalah probabilitas kumulatif (posisi plot, dalam jargon umum) dan kotak median-dan-kuartil konvensional dapat ditarik sedemikian rupa sehingga (pada prinsipnya) setengah nilai ada di dalam kotak, seperti yang selalu diiklankan, dan setengah dari nilai di luar. Garis horizontal ekstra di sini mewakili nilai tengah. Beberapa orang menambahkan cara ke kotak plot sebagai titik tambahan atau simbol penanda; Saya menemukan bahwa dapat berbenturan dengan menampilkan data sendiri, dan saya lebih suka garis tambahan. Jika garis untuk median dan garis untuk mean muncul bersamaan, Anda perlu memikirkan apa yang harus dilakukan. Hampir selalu rata-rata dan median berbeda secara nyata.
Bisa dibilang itu adalah standar untuk membuat satuan pengukuran eksplisit pada grafik, tapi saya tidak melihat apa itu.
(Saya sengaja mendorong poin tambahan di sini, yaitu grafik bisa sangat kecil tapi masih informatif. Dalam praktiknya, saya tidak akan membuat mereka sekecil ini.)
EDIT:
Referensi silang ditambahkan ke plot kotak kuantil secara luas dalam pengertian Parzen (referensi lebih lanjut di urutan kedua di bawah ini; ada penggunaan lain "plot kotak kuantil")
Bagaimana saya bisa mengukur perbedaan antara data non-parametrik dengan banyak nol?
Bagaimana cara menggunakan boxplots untuk menemukan titik di mana nilai lebih cenderung berasal dari kondisi yang berbeda?
Bagaimana memvisualisasikan uji-t dua sampel independen?
Bagaimana cara saya mendapatkan eksperimen yang lebih baik menggunakan Uji U-Whitney?
Shera, DM 1991. Beberapa penggunaan plot kuantil untuk meningkatkan presentasi data. Ilmu Komputer dan Statistik 23: 50-53.
Militký, J. dan M. Meloun. 1993. Beberapa alat bantu grafis untuk analisis data eksplorasi univariat. Analytica Chimica Acta 277: 215-221.
Meloun, M. dan J. Militky. 1994. Perawatan data berbantuan komputer dalam chemometrics analitik. I. Analisis eksplorasi data univariat. Makalah Kimia 48: 151-157.
EDIT 2:
Poin utama utas-utas ini bukan hanya untuk menjawab pertanyaan langsung, tetapi untuk menyentuh pertanyaan-pertanyaan serupa yang mungkin menarik minat orang lain.
Beberapa desain grafik lain dalam jawaban lain di sini menunjukkan pengidentifikasi, diberi label agnostik 1 ... 14 tanpa adanya detail lainnya. Andaikata ini dan pengidentifikasi lainnya digunakan dalam interpretasi, desain sederhana untuk menunjukkan kepada mereka adalah grafik titik (Cleveland). Berikut adalah dua di antara beberapa kemungkinan, di mana urutan pengidentifikasi dihormati secara harfiah (kiri) dan di mana nilainya diurutkan (kanan). Ada banyak ruang untuk label yang lebih panjang jika diperlukan.
Keuntungan dari desain ini daripada grafik batang adalah bahwa sumbu respons atau hasil dapat dimulai pada nilai bukan nol jika itu tampaknya pilihan yang lebih baik.
Memutar grafik sehingga sumbu respons vertikal dapat dibayangkan dengan mudah juga.
sumber
@Nick Cox telah memberikan beberapa contoh yang baik, dua opsi lain yang sering saya gunakan adalah plot kotak dengan poin overlay, atau sedikit gugup,
Dengan Kode R
EDIT: Anda juga bisa menggunakan plot biola jika diinginkan
sumber
Pertanyaan Anda mengingatkan saya pada teknik yang dijelaskan dalam posting blog ini . Ini tentang visualisasi peristiwa diskrit.
Trik intinya adalah merencanakan
the time before an event
xthe time after an event
.Ini mungkin kebetulan, tetapi ke atas area tengah tidak mengandung data. Jadi ada beberapa struktur yang terlihat.
Kode cepat dan kotor
R
.sumber
text
mengambil argumen vektor -text(x, y, 1:12)
harus bekerja.Gagasan lain, karena Anda menggunakan waktu.
Plot arena pacuan kuda - barplot dengan koordinat kutub - memberikan efek yang sama seperti stopwatch:
Idealnya label pengamatan akan ditumpangkan di bar atau setidaknya di ujung lainnya. Saat ini pemirsa memiliki tekanan ekstra untuk melacak pengamatan mana yang (naik / turun) saat melakukan perbandingan.
sumber