Apa aturan penting untuk mendesain dan memproduksi plot?

19

Latar Belakang:

Sebelumnya di Cross Validated, kami memiliki pertanyaan tentang:

Disarankan oleh @david dalam komentar untuk pertanyaan ini bahwa kita harus memiliki pertanyaan wiki komunitas dengan satu aturan visualisasi per jawaban yang dapat dipilih oleh masyarakat.

Pertanyaan

Apa aturan penting dalam mendesain dan memproduksi representasi data grafis?

Aturan

  • Satu aturan per jawaban
  • Idealnya, sertakan penjelasan singkat tentang mengapa menurut Anda itu ide yang bagus
  • Jawaban dengan contoh (kode dan gambar) praktik yang baik dan buruk disukai.
Jeromy Anglim
sumber

Jawaban:

13

Substansi atas Formulir : Pilih plot, gaya, pewarnaan, atau parameter grafis lainnya yang sesuai untuk menunjukkan apa yang ingin ditampilkan plot, daripada apa yang seharusnya dibolehkan paket grafik Anda.

Fomite
sumber
8
(+1) Saya sering lebih memilih untuk membuat sketsa grafik di atas kertas terlebih dahulu untuk mengurangi kemungkinan bahwa keputusan desain saya akan dipandu oleh jalur resistensi paling sedikit yang dibuat oleh perangkat lunak grafik.
Jeromy Anglim
13

Menjadi akrab dengan tiga dimensi warna dapat membantu. Jika Anda menggunakan beberapa warna, idealnya berbeda pada beberapa dimensi tersebut, bukan hanya satu.

Nilai. Grafik harus tetap dapat dibaca bahkan dalam warna hitam dan putih. Aturan sederhana ini harus menjelaskan kebutaan warna, printer berkualitas rendah dan kondisi pencahayaan buruk. Bahkan jika Anda menggunakan rona berbeda, pastikan nilainya cukup berbeda. Secara khusus, plot harus gelap pada latar belakang terang (atau sebaliknya), tetapi tidak abu-abu pada nilai abu-abu. Contoh terburuk adalah plot biru dengan latar belakang merah - keduanya adalah nilai tengah, yaitu, akan memberikan warna abu-abu yang sangat mirip setelah konversi dalam warna hitam dan putih.

Kejenuhan. Saturasi harus digunakan dengan moderasi: garis merah murni mungkin baik-baik saja, tetapi garis merah yang lebih tebal dan kurang jenuh akan lebih mudah dibaca (peningkatan ketebalan membantu membedakan warna dan memungkinkan Anda mengurangi saturasi). Di sisi lain, area merah murni menyakitkan untuk dilihat: jangan gunakan warna jenuh untuk mengisi area. The Brewer palet warna (dirancang untuk peta, tidak plot line) memberikan contoh pilihan warna rendah saturasi. Contoh terburuk adalah, sekali lagi, latar belakang jenuh (biru pada merah atau merah pada biru).

Warna. Seperti disebutkan oleh @gung, hindari kombinasi merah / hijau (lampu lalu lintas): ada jauh lebih banyak orang buta warna daripada yang Anda pikirkan. Apalagi dengan rona, lebih sedikit lebih banyak. Misalnya, untuk memplot nilai "menyimpang" (yaitu, jumlah yang bisa positif atau negatif), hanya gunakan dua rona (untuk nilai positif dan negatif), sehingga pembaca dapat segera membedakan mana yang tinggi dan mana yang rendah. Menggunakan gradien diskrit dapat menghasilkan plot yang lebih mudah dibaca: batas antara warna menjadi terlihat dan membentuk plot kontur.

Anda mungkin ingin membaca Aturan Praktis S.Sew untuk Penggunaan Warna dalam Grafik atau merujuk pada materi tentang "Teori Warna" untuk siswa seni atau desain.

Vincent Zoonekynd
sumber
+1, informasi yang bagus di sini. Poin Anda tentang nilai dan bagaimana warna akan ditampilkan setelah konversi menjadi hitam dan putih sangat baik. Tautan ke Beberapa kertas juga membantu. Satu catatan: lebih baik tidak merujuk ke jawaban lain sebagai "di atas", gunakan @ begitu-dan-begitu; jawaban bergerak berdasarkan berapa banyak suara yang mereka dapatkan.
gung - Reinstate Monica
11

Tempatkan sebanyak mungkin informasi yang diperlukan dalam gambar itu sendiri. Jangan meminta pembaca untuk referensi keterangan, misalnya untuk mengidentifikasi arti dari berbagai simbol atau warna. Tempatkan informasi apa pun (atau informasi tambahan) yang tidak dapat masuk ke gambar itu sendiri dalam keterangan. Idenya adalah untuk meminimalkan upaya yang diperlukan oleh penampil grafik untuk mengekstrak informasi yang relevan - terbaik : grafik cukup jelas, terbaik berikutnya: informasi tambahan yang diperlukan dapat dengan cepat diperoleh dari keterangan, terburuk: penampil harus membaca dengan cermat melalui seluruh bagian hasil mencari beberapa detail penting untuk mencari tahu apa yang sedang terjadi.

David
sumber
1
+1, dan kami dapat memperluas gagasan ini lebih lanjut: Kami ingin membuatnya agar orang dapat melihat grafik dan mengetahui (sebanyak mungkin) apa yang sedang terjadi tanpa harus membaca keterangan, dan juga ketika mereka membutuhkan informasi tambahan untuk memiliki yang tersedia di keterangan sehingga orang dapat membaca keterangan dan tahu apa yang mereka butuhkan tanpa harus membaca makalah mencari satu detail penting.
gung - Pasang kembali Monica
1
@ung karena ini CW, silakan mengedit jawaban untuk mencerminkan komentar Anda.
David LeBauer
10

Buat plot sesederhana mungkin. Dalam kata-kata Tufte, 'meminimalkan rasio data-tinta'.

Misalnya, hindari:

  • lebih banyak warna atau bentuk dari yang dibutuhkan
  • lebih banyak tanda centang daripada yang diperlukan
  • Efek 3-D pada plot 2-D.
  • menggunakan legenda saat objek dapat dilabeli secara langsung
David LeBauer
sumber
Saya tidak setuju dengan Tufte di sini. Pertama, sebagian besar motivasi untuk aturan ini dalam buku aslinya, adalah berapa banyak waktu yang Anda habiskan untuk menggambar garis-garis tambahan yang tidak perlu; tetapi ini tidak relevan hari ini. Kedua, ide sebenarnya lebih baik ditangkap oleh aturan Cleveland untuk memaksimalkan keinformatifan dari grafik, karena kadang-kadang plot dapat menjadi lebih informatif dengan lebih banyak tinta, tetapi kedua aturan melarang para chartjunk yang menyinggung Tufte.
gung - Reinstate Monica
@ung di mana upaya / waktu yang diperlukan disajikan sebagai motivasi oleh Tufte. Saya tidak ingat bagian ini (tetapi saya juga tidak memiliki teks yang berguna).
David LeBauer
1
Saya juga tidak memilikinya, tetapi dalam bukunya Visual Display yang pertama saya ingat dia berbicara tentang berapa kali Anda harus meletakkan penggaris untuk menggambar grafik. Mungkin "besar" terlalu berlebihan, tetapi saya ingat membaca ini dan berpikir, 'siapa yang peduli tentang itu sekarang?' Dalam Elements , Cleveland membuat argumen yang meyakinkan bahwa aturan Tufte keliru. Dia berpendapat bahwa intinya adalah untuk memaksimalkan transfer informasi dan menunjukkan bahwa prinsip ini juga menghilangkan apa yang tidak disukai Tufte, tetapi memungkinkan untuk kasus-kasus (yang dia tunjukkan) di mana tinta non-data tambahan membantu membuat grafik lebih informatif.
gung - Reinstate Monica
Saya harus menjelaskan, saya tidak setuju dengan beberapa saran spesifik (mis., Tidak ada 3D, tidak ada chartjunk); Saya berdalih dengan aturan Tufte sebagai pedoman untuk grafis.
gung - Pasang kembali Monica
@ung saya menafsirkan diskusi yang sama sebagai alat heuristik - cara mudah bagi pembaca untuk memahami pendekatan, daripada cara untuk mengurangi pekerjaan perancang.
David LeBauer
9

Biarkan waktu untuk mengedit. Membuat grafik yang baik membutuhkan waktu dan seringkali (setidaknya untuk saya) mencoba berulang kali.

Peter Flom - Pasang kembali Monica
sumber
6

Jangan menentang merah dan hijau. Warna bisa membantu, tetapi ketika menggunakan warna selalu ingat bahwa sebagian besar orang buta warna merah-hijau. Saya pernah menunjukkan beberapa data kepada seseorang, dan dia tidak bisa melihat apa yang terjadi dalam grafik saya - itu sia-sia dan saya merasa sangat bodoh. Bentuk buta warna lainnya sangat jarang, tetapi merah-hijau cukup umum. Halaman ini memiliki banyak informasi bagus. Berikut beberapa tips:

  • Jika Anda hanya membutuhkan dua warna, gunakan biru dan kuning - jangan gunakan merah dan hijau.
  • Jika Anda membutuhkan gradien, beralih dari biru menjadi kuning sambil mengubah saturasi dan cahaya secara bersamaan - jangan gunakan pelangi.
  • Jika Anda perlu menyandikan lebih dari dua elemen (misalnya, titik pada sebar dari lebih dari dua kelompok, atau beberapa garis) kembalikan warna Anda dengan simbol / gaya garis yang berbeda pula. Misalnya, simbol plot yang berbeda: o + <sw, atau garis: padat, putus-putus, putus-putus, dot-putus, dll (Anda juga dapat menambahkan simbol ploting ke garis Anda atau mengubah bobot garis).
gung
sumber
Ini memang sesuatu yang agak sering saya tanyakan: Apa gradien warna terbaik untuk digunakan?
steffen
4

Jangan gunakan grafik batang bertumpuk. Dan pada catatan terkait, jika Anda memiliki item skala Likert, jangan merasa perlu untuk menunjukkan proporsi untuk setiap respons untuk setiap item. Grafik itu membuat mataku berdarah.

Jangan gunakan diagram lingkaran.

Jangan menduplikasi data yang terkandung dalam grafik dengan melemparkan dalam tabel.

Gunakan font sans serif seperti Arial untuk judul grafik, dll, karena jenis font tersebut dirancang untuk digunakan dengan cara itu.

Tidak ada posting pada desain yang lengkap tanpa referensi buku, saya sangat suka Aturan Statistik Thumb . Bab 9 adalah bit yang relevan dengan diskusi di sini, dan bit yang saya tunjukkan ketika ditanya mengapa saya membenci grafik batang dan diagram lingkaran. :)

Pengakuan: di salah satu peran konsultasi mahasiswa pertama saya untuk klien LSM kecil, saya memberi mereka laporan yang memiliki banyak grafik batang, dicetak dalam warna (ini adalah pertengahan 1990-an). Saya pikir saya berhasil mendapatkan kuning, ungu, dan merah pada anak-anak anjing itu.

Michelle
sumber
3

Jangan main-main dengan kapak. Jangan memotong seratus unit pertama hanya karena kemiringan grafik terlihat lebih mengesankan. Gambar akan menempel dan orang akan mengingat efek yang jauh lebih besar daripada yang sebenarnya diukur.

xmjx
sumber
2
Memotong data untuk mengubah kemiringan yang tampak adalah penipuan. OTOH, ada pertanyaan nyata tentang apakah sumbu harus selalu menyertakan 0, dan (agak kurang terkait) rasio aspek yang digunakan. Cleveland membuat kasus yang kuat bahwa grafik lebih informatif jika Anda memaksimalkan data dalam jendela data, dan kemiringan 'bank' hingga 45 derajat. Kenali audiens Anda, di sini: Cleveland berpendapat bahwa audiensi profesional harus dianggap kompeten dan terpelajar, tetapi dengan audiens yang naif, baik secara eksplisit menunjukkan fitur ini dan menjelaskannya, atau (mungkin) tidak menggunakannya.
gung - Pasang kembali Monica
Bahkan audiens profesional akan (saya berasumsi) beberapa bulan kemudian hanya akan mengingat garis curam dalam grafik dan akan melupakan intersepsi dan segala hal lainnya. Anda dapat memiliki semua data dalam grafik (datar) dengan memberi label nilai ekstrem dengan benar dan masih memiliki informasi di dalamnya bahwa tidak ada yang benar-benar berubah dari waktu ke waktu.
xmjx
2
Saya tidak setuju. Saya tidak berpikir itu adalah aturan yang masuk akal untuk bersikeras semua sumbu dimulai dari nol, jika itu yang disarankan. Grafik harus menunjukkan variasi dan struktur dalam data - jika yang penting adalah fluktuasi 100.000 di sekitar nilai dua juta (dan mungkin bagaimana perbedaannya antara dua kelompok), grafik harus menunjukkan bahwa, bukan "dua juta adalah jumlah yang besar ".
Peter Ellis
Seperti pada dasarnya setiap aturan desain, saya pikir ini adalah salah satu yang dapat Anda langgar jika Anda benar-benar memahami arti praktis dari variasi yang direncanakan dan bagaimana audiens Anda akan menafsirkannya. Tetapi aturan ini dilanggar begitu sering dan begitu mengerikan sehingga saya pikir relatif aman untuk menyatakan dengan keras "Semua plot harus memasukkan nol! *" Pencarian Google terhadap plot kepemilikan rumah di Amerika menggambarkan hal ini dengan baik - di hampir setiap plot, sepertinya kepemilikan rumah berfluktuasi. liar selama dua dekade terakhir, padahal sebaran maksimumnya sekitar 5%.
Matt Parker
Bukan berarti 5% tidak relevan - dan sebagian besar plot tersebut dikaitkan dengan argumen tentang konsekuensi kebijakan yang menghasilkan fluktuasi itu. Tapi saya pikir argumen itu akan lebih kuat jika mereka menekankan bagaimana kebijakan besar-besaran dengan konsekuensi ekonomi yang besar sebenarnya memiliki efek yang relatif kecil pada kepemilikan rumah.
Matt Parker