Banyak yang telah ditulis tentang pilihan warna ramah buta warna untuk peta, poligon, dan wilayah yang diarsir secara umum (lihat misalnya http://colorbrewer2.org ). Saya belum dapat menemukan rekomendasi untuk warna garis dan ketebalan garis yang bervariasi untuk grafik garis. Sasarannya adalah:
- mudah membedakan garis bahkan ketika mereka saling terkait
- garis mudah dibedakan oleh individu dengan bentuk buta warna yang paling umum
- (kurang penting) baris ramah-printer (lihat Penyeduh Warna di atas)
Dalam konteks garis skala hitam dan abu-abu, saya merasa sangat efektif memiliki garis hitam tipis dan garis abu-abu lebih tebal. Saya akan menghargai rekomendasi spesifik yang mencakup berbagai warna, tingkat skala abu-abu, dan ketebalan garis. Saya tidak suka berbagai jenis garis (padat / putus-putus / putus-putus) tetapi bisa dibantah pendapat itu.
Lebih disukai memiliki rekomendasi hingga 10 kurva pada satu grafik. Yang lebih baik adalah seperti Color Brewer: memungkinkan rekomendasi untuk baris m untuk tidak menjadi subset rekomendasi untuk n baris di mana n> m, dan memvariasikan m dari 1 hingga 10.
Harap dicatat : Saya juga menghargai panduan yang hanya membahas bagian pewarnaan garis dari pertanyaan.
Beberapa praktisi menambahkan simbol ke garis setiap beberapa sentimeter untuk membedakan kelas dengan lebih baik. Saya tidak terlalu menyukai yang membutuhkan lebih dari satu fitur (misalnya, warna + tipe simbol) untuk membedakan kelas, dan kadang-kadang ingin memesan simbol untuk menunjukkan informasi yang berbeda.
Dengan tidak adanya panduan lain, saya mengusulkan untuk menggunakan warna yang sama yang direkomendasikan untuk poligon di colorbrewer2.org untuk garis, dan untuk mengalikan lebar garis dengan 2,5 untuk garis yang digambar dengan warna yang kurang cerah / pekat. Saya membuat fungsi R yang mengatur ini. Selain warna bir warna saya pikir saya akan membuat 2 warna pertama menjadi hitam solid (tipis) dan skala abu-abu (tebal) meskipun orang bisa berpendapat bahwa mereka harus hitam solid tipis dan biru tipis.
Fungsi R dapat ditemukan di http://biostat.mc.vanderbilt.edu/wiki/pub/Main/RConfiguration/Rprofile . Setelah Anda menentukan fungsi, colBrew
Anda dapat melihat cara kerja pengaturan dengan mengetik
showcolBrew(number of line types) # add grayscale=TRUE to use only grayscale
Fungsi latticeSet
juga diberikan, untuk mengatur lattice
parameter grafik ke pengaturan baru. Perbaikan algoritma disambut dengan baik.
Untuk menjelajahi : dichromat
paket R : http://cran.r-project.org/web/packages/dichromat/
sumber
Jawaban:
Saya akan mencoba untuk menjadi provokatif di sini dan bertanya-tanya apakah tidak adanya pedoman seperti itu muncul karena ini adalah masalah yang hampir tidak terpecahkan. Orang-orang di bidang yang sangat berbeda tampaknya setuju untuk sering berbicara tentang "plot spageti" dan masalah yang mereka hadapi dalam membedakan seri yang berbeda.
Secara konkret, kumpulan garis untuk beberapa deret waktu individual dapat secara kolektif menyampaikan pola umum dan terkadang deret individual yang berbeda dari pola tersebut.
Namun, pertanyaan saya adalah tentang membedakan semua rangkaian waktu individu ketika mereka memiliki identitas yang Anda sayangi.
Jika Anda mengatakan seri 2 atau 3, seri pembeda biasanya tidak terlalu sulit, dan saya akan cenderung menggunakan garis padat dalam dua atau tiga warna merah, biru atau hitam. Saya juga bermain dengan oranye dan biru seperti yang digunakan oleh Hastie dan teman-teman (lihat jawaban dari @ user31264).
Memvariasikan pola garis (solid, dash, putus-putus, dll.) Saya hanya menemukan nilai terbatas. Garis putus-putus cenderung tersapu secara fisik dan mental dan kombinasi titik-titik dan garis yang lebih halus terlalu halus (artinya, sedikit) berbeda dengan keberhasilan dalam praktik.
Saya akan mengatakan masalahnya sebelum Anda memiliki 10 seri. Kecuali mereka sangat berbeda, seri 5 atau lebih bisa jadi terlalu sulit untuk dibedakan. Psikologi yang umum tampaknya adalah bahwa orang memahami prinsip bahwa rangkaian yang berbeda ditunjukkan dengan warna yang berbeda dan atau simbolisme dengan sangat baik, tetapi tidak memiliki kecenderungan untuk bekerja keras melacak garis-garis individu dan mencoba untuk mengadakan cerita tentang persamaan dan perbedaan di kepala mereka. . Bagian dari ini sering berasal dari penggunaan legenda (atau kunci). Ini kontroversial, tetapi saya akan mencoba memberi label pada seri yang berbeda pada grafik sedapat mungkin. Moto saya di sini adalah "Kalah legenda, atau bunuh kuncinya, jika Anda bisa".
Saya telah menjadi fonder dari pendekatan yang berbeda untuk menampilkan beberapa seri waktu, di mana semua rangkaian waktu yang berbeda ditampilkan berulang kali di beberapa panel, tetapi yang berbeda disorot di masing-masing. Itu adalah perpaduan dari satu ide lama (a) kelipatan kecil (seperti Edward Tufte menyebutnya) dan ide lama lainnya (b) menyoroti serangkaian minat tertentu. Pada gilirannya itu mungkin hanya ide lama yang ditemukan kembali, tetapi sejauh ini saya hanya dapat menemukan referensi terbaru. Lebih banyak di utas ini tentang Statalist .
Dalam hal warna, saya yakin menggunakan abu-abu untuk deret waktu yang merupakan latar belakang apa pun yang sedang ditekankan. Itu tampaknya konsisten dengan sebagian besar jurnal yang layak diterbitkan.
Inilah satu percobaan. Data adalah hasil biji-bijian dari 17 plot di Broadbalk Fields di Rothamsted 1852-1925 dan berasal dari Andrews, DF dan Herzberg, AM (Eds) 1985. Data: Kumpulan masalah dari berbagai bidang untuk siswa dan pekerja penelitian . New York: Springer, Tabel 5.1 dan dapat diunduh dari berbagai tempat (mis. Masukkan uraian tautan di sini . (Detail: Data ada dalam blok 4 baris untuk setiap tahun; baris ketiga dan keempat adalah untuk hasil jerami, tidak diplot di sini. pengidentifikasi plot tidak eksplisit dalam tabel itu.)
Saya tidak memiliki keahlian khusus tentang data seperti ini; Saya hanya ingin beberapa seri waktu yang tidak dapat (dengan mudah) dianggap kecil karena panjang seri atau jumlah panel. (Jika Anda memiliki ratusan, ribuan, ... panel, pendekatan ini benar-benar tidak banyak membantu.) Yang saya bayangkan adalah bahwa seorang analis data, mungkin berbicara dengan ahli materi pelajaran, dapat mengidentifikasi berbagai kesamaan dan perilaku yang tidak biasa di sini dan dapatkan wawasan dan informasi dengan demikian.
Jelas resep ini dapat digunakan untuk banyak jenis plot lainnya (misalnya plot pencar atau histogram dengan masing-masing bagian disorot secara bergantian); bersama-sama dengan memesan panel sesuai dengan beberapa ukuran atau kriteria yang menarik atau berguna (misalnya dengan median atau persentil ke-90 atau SD); dan untuk hasil model serta data mentah.
sumber
Pertanyaan 2 dan 3 Anda jawab sendiri - palet pembuat bir berwarna cocok. Pertanyaan yang sulit adalah 1, tapi seperti Nick, aku khawatir itu didasarkan pada harapan yang salah. Warna garis bukanlah yang membuat seseorang dapat membedakan antara garis dengan mudah, itu didasarkan pada kontinuitas dan seberapa berliku garis itu. Dengan demikian ada pilihan berdasarkan desain, selain warna atau pola garis putus-putus, yang akan membantu membuat plot lebih mudah untuk ditafsirkan.
Saya akan mencuri salah satu diagram Frank yang menunjukkan fleksibilitas splines untuk memperkirakan berbagai fungsi berbentuk berbeda pada domain terbatas sebagai contoh.
Sekarang ini menghasilkan 20 baris yang kusut, tantangan yang sulit untuk divisualisasikan.
Berikut adalah plot yang sama dalam kelipatan kecil, dengan ukuran yang sama, menggunakan panel yang dibungkus. Sedikit lebih sulit untuk membuat perbandingan antar panel, tetapi bahkan dalam ruang yang menyusut, akan lebih mudah untuk memvisualisasikan bentuk garis.
Satu hal yang Stephen Kosslyn buat dalam buku-bukunya adalah bahwa bukan berapa banyak garis yang berbeda membuat plot menjadi rumit, melainkan berapa banyak jenis bentuk garis yang dapat diambil. Jika 20 panel menjadi terlalu kecil, Anda sering dapat mengurangi set ke lintasan yang sama untuk ditempatkan di panel yang sama. Masih sulit untuk membedakan antara garis-garis dalam panel, menurut definisi mereka akan berdekatan setiap kali dan tumpang tindih, tetapi mengurangi kompleksitas membuat antara perbandingan panel cukup sedikit. Di sini saya sewenang-wenang mengurangi 20 baris menjadi 4 pengelompokan terpisah. Ini memiliki manfaat tambahan bahwa pelabelan garis secara langsung lebih sederhana, ada lebih banyak ruang di dalam panel.
Ada ungkapan umum yang berlaku untuk situasi ini, jika Anda fokus pada semua yang Anda fokuskan pada apa pun . Dalam kasus dengan hanya sepuluh garis, Anda memiliki
(10*9)/2=45
pasangan garis yang memungkinkan untuk dibandingkan. Kami mungkin tidak tertarik pada semua 45 perbandingan di sebagian besar keadaan, kami entah tertarik untuk membandingkan garis tertentu satu sama lain atau membandingkan satu baris dengan distribusi sisanya. Jawaban Nick menunjukkan yang terakhir dengan baik. Menggambar garis latar belakang tipis, berwarna terang, dan semi-transparan, dan kemudian menggambar garis latar depan dengan warna cerah dan lebih tebal akan cukup. (Juga untuk perangkat, pastikan untuk menggambar garis latar depan di atas garis lainnya!)Jauh lebih sulit untuk membuat layering di mana setiap garis individu dapat dengan mudah dibedakan dalam kusut. Salah satu cara untuk mencapai diferensiasi latar depan-latar belakang dalam kartografi adalah penggunaan bayangan, (lihat makalah ini oleh Dan Carr untuk contoh yang baik). Ini tidak akan menskala hingga 10 baris, tetapi dapat membantu untuk 2 atau 3 baris. Berikut ini adalah contoh untuk lintasan di Panel 1 menggunakan Excel!
Ada poin lain yang harus dibuat, seperti garis abu-abu terang bisa menyesatkan jika Anda memiliki lintasan yang tidak mulus. Misalnya Anda dapat memiliki dua lintasan dalam bentuk X, atau dua dalam bentuk satu sisi kanan atas dan ke bawah V. Menggambar mereka dengan warna yang sama Anda tidak akan dapat melacak garis, dan inilah mengapa beberapa orang menyarankan menggambar plot koordinat paralel menggunakan garis halus atau jittering / off-setting titik ( Graham dan Kennedy, 2003 ; Dang et al., 2010 ).
Jadi saran desain dapat berubah tergantung pada tujuan akhir dan sifat data. Tetapi ketika membuat perbandingan bivariat antara lintasan merupakan hal yang menarik, saya pikir pengelompokan lintasan yang sama dan menggunakan kelipatan kecil membuat plot lebih mudah untuk diinterpretasikan dalam berbagai keadaan. Saya merasa ini umumnya lebih produktif daripada kombinasi warna / garis garis akan di plot yang rumit. Plot panel tunggal dalam banyak artikel jauh lebih besar dari yang seharusnya, dan membelah menjadi 4 panel biasanya dimungkinkan dalam batasan halaman tanpa banyak kerugian.
sumber
Dari "Elemen Pembelajaran Statistik" oleh Trevor Hastie et al. :
"Edisi pertama kami tidak ramah bagi pembaca buta warna; khususnya, kami cenderung menyukai kontras merah / hijau yang sangat menyusahkan. Kami telah mengubah palet warna dalam edisi ini sebagian besar, menggantikan yang di atas dengan kontras oranye / biru. "
Anda mungkin ingin melihat grafiknya.
Anda juga dapat menggunakan garis putus-putus, bertitik dll.
sumber
Saya telah melihat sangat sedikit perhatian diberikan pada "ketebalan garis" dalam hal visualisasi data yang tepat. Mungkin kemampuan untuk membedakan ketebalan garis yang berbeda tidak beragam seperti kemampuan untuk membedakan warna.
Beberapa sumber:
Beberapa kursus:
sumber
Meskipun saya setuju bahwa tidak ada solusi unik untuk masalah ini, saya menggunakan rekomendasi dari blog ini:
http://blogs.nature.com/methagora/2013/07/data-visualization-points-of-view.html
Posting pada warna mengatasi masalah buta warna dan pencetakan skala abu-abu dan memberikan contoh skala warna yang memecahkan kedua masalah ini.
Dalam artikel yang sama dianalisis juga skala warna kontinu, yang banyak digunakan untuk plot panas dan sebagainya. Dianjurkan untuk tidak menggunakan pelangi, karena beberapa transisi yang tajam (seperti zona kuning, jauh lebih kecil daripada merah). Sebagai gantinya, dimungkinkan untuk melakukan transisi di antara pasangan warna lainnya.
Satu set warna yang bagus untuk tujuan ini adalah biru dan oranye (klasik!). Anda dapat melakukan tes, dengan menerapkan filter buta-warna dan abu-abu dan melihat apakah Anda masih dapat melihat perbedaannya.
Untuk ketebalan garis, beberapa masalah blog yang disebutkan sebelum membahas poin ini. Garis, jika Anda memiliki banyak, harus memiliki ketebalan yang sama, yaitu "tipis". Gunakan garis tebal hanya jika Anda ingin memperhatikan objek itu.
sumber