Memformat grafik: kapan waktu yang tepat untuk menggunakan isian di bawah grafik garis?

13

Ini adalah pertanyaan visualisasi data - Saya harap tidak ada masalah untuk menanyakannya di sini.

Kapan tepat menggunakan isian di bawah grafik garis untuk rangkaian waktu, seperti grafik di bawah ini? (yang menampilkan waktu ping lebih dari sehari)

Grafik garis dengan isian di bawahnya

Saya kira lebih umum menggunakan garis polos, tanpa isian di bawahnya, tetapi apakah boleh menggunakan isian untuk variasi visual?

Saya akan sangat tertarik mengetahui tentang penelitian persepsi tentang topik ini, atau panduan gaya.

Richard
sumber
1
Jika 0sbatas bawah alami dan Anda menunjukkannya, lalu mengapa tidak?
ttnphns
1
Tanyakan cara lain - mengapa menggunakan isi jika tidak perlu? Bayangkan Anda ingin menambahkan garis tren lain dan segala sesuatunya menjadi tidak perlu rumit. Saya juga akan memisahkan unit dan skala y-axis '.
martin

Jawaban:

11

Ada sedikit seni untuk menyeimbangkan aspek estetika dan informatif dari grafik. Konsultan / penulis visualisasi terkemuka seperti Edward Tufte dan Stephen Few memilih estetika minimal yang menghindari gangguan dari bagian informatif grafik. Namun, untuk beberapa audiens sejumlah kecil dibenarkan - lihat aplikasi visualisasi data jurnalistik Alberto Cairo, misalnya.

Sudut penelitian persepsi adalah bahwa setiap elemen grafis mengkomunikasikan pesan, beberapa yang tidak kita sadari karena korteks visual kita berurusan dengannya (" pemrosesan sebelum perhatian "). Elemen tambahan, bahkan yang berlebihan, dapat menghasilkan pemrosesan ekstra. Grafik yang sesuai tergantung pada pesan yang akan dikomunikasikan dan audiens.

Untuk pertanyaan spesifik Anda, garis terhubung menekankan tren (dan variasi dari tren). Area yang diisi menekankan penyimpangan dari baseline. Bagan batang atau bagan jarum akan menekankan peristiwa terpisah yang menyimpang dari garis dasar.

Konteks grafik juga penting. Jika Anda memiliki kisi-kisi grafik yang sangat padat, isian akan membantu mengaitkan setiap baris dengan garis dasarnya.

Akhirnya, pertimbangan lain untuk menambahkan elemen grafis berlebihan / florish adalah membuatnya lebih sulit untuk memperpanjang grafik dengan elemen yang lebih informatif. Misalnya, Anda mungkin ingin menyorot nilai khusus, overlay garis tren lain atau overlay band, seperti pada mock-up berikut.

masukkan deskripsi gambar di sini

xan
sumber
1
Saya setuju dengan ini. Kecuali jika grafiknya perlu berwarna-warni karena sampul depan majalah / buku (dan orang-orang pemasaran menginginkannya diwarnai), warna harus digunakan untuk menginformasikan. Jika grafik terlihat "membosankan" maka pelakunya adalah fakta bahwa informasi yang mendasarinya tidak terlalu menarik sama sekali atau tidak terlalu menarik dalam format grafik garis. Dalam kasus seperti itu mungkin akan lebih berguna dalam diagram lingkaran, plot radar atau yang lainnya.
rocinante
1
Saya sarankan tidak menggunakan diagram lingkaran. Lebih sulit untuk merasakan perbedaan panjang busur dan area baji daripada perbedaan ketinggian. Jika Anda tidak percaya kepada saya, bandingkan diagram lingkaran dalam rasio 32:34:33 dengan grafik batang yang sama. Yang mana yang lebih mudah dibaca?
shadowtalker
2
Saya berbicara secara umum, tidak khusus untuk grafik di atas. Setiap jenis grafik memiliki kelebihannya. Jenis grafik tertentu tidak sesuai untuk semua situasi.
rocinante
4

Beberapa hal lagi yang perlu dipertimbangkan:

Seperti disebutkan dalam komentar, underfill sebagian besar tidak pantas jika sumbu x tidak pada titik nol y alami. Ini mungkin karena sumbu y diskalakan untuk mulai pada angka selain nol, atau karena unit yang digunakan tidak memiliki interpretasi nol alami (misalnya Kelvin memiliki nol alami, sedangkan Celsius tidak.)

Kedua, kasus ketika underfill sangat valid adalah jika data itu sendiri dapat dianggap kurang diisi. Misalnya, bagan garis ketinggian gunung masuk akal untuk kurang diisi, warna isi mewakili bumi, sedangkan tidak terisi mewakili udara.

Contoh terkait mungkin menghitung data. Jika kita menumpuk semua individu di setiap titik x, kita akan mendapatkan diagram batang. Jika interpolasi antara bar masuk akal kita akan berakhir dengan bagan garis dengan isi yang kurang.

Gambar ini dari 'tampilan visual informasi kuantitatif' Mungkin menjelaskannya sedikit lebih baik. Ini menunjukkan unit militer mana yang berada di Eropa selama perang kedua (saya pikir). Menumpuk unit pada setiap titik waktu memberi Anda bagan batang yang kurang terisi. Menggambar garis dari atas data memberi Anda bagan garis yang kurang terisi.

timcdlucas
sumber
2
... Unit militer AS berada di Eropa selama Perang Dunia Pertama (tanggal 1917 dan 1918 menceritakan kisahnya).
Nick Cox
@nickCox Tentu saja. Tidak tahu mengapa saya tidak melihat itu.
timcdlucas
4

Dua jawaban sebelumnya mencakup poin-poin penting utama, tetapi ada beberapa hal yang masih harus disebutkan.

Pertama, saya harus mengatakan bahwa saya tidak setuju dengan pendekatan minimalis ekstrim untuk grafik - bahwa semua tinta yang berlebihan harus hilang. Variasi yang mengganggu dan tidak berarti harus pergi. Tetapi area padat versus satu garis dapat menangkap mata lebih baik dan berkomunikasi lebih banyak dalam sekejap. Dan seperti yang Anda katakan, itu dapat menambahkan "variasi visual".

Namun, seperti yang ditunjukkan oleh @xan, pandangan sekilas itu juga menginterpretasikan area secara berbeda dari garis, dengan cara yang sebagiannya tidak disadari.

Grafik area menyiratkan jumlah total yang terakumulasi saat Anda melanjutkan sepanjang sumbu x. Jika Anda membandingkan dua grafik, dan satu memiliki area yang lebih besar diisi, pandangan Anda akan memberi tahu Anda bahwa itu memiliki total yang lebih besar terlepas dari nilai awal dan akhir.

Sebaliknya, grafik garis menunjukkan nilai yang berubah. Fokusnya adalah pada perubahan posisi dari satu titik ke titik berikutnya, bukan pada total akumulasi.

Jadi kapan Anda harus menggunakan grafik area?

  • ketika nilai-nilai mewakili kuantitas yang jelas dengan titik nol yang pasti ditunjukkan pada grafik;
  • ketika nilai mewakili jumlah yang ditambahkan (atau dihapus) di setiap titik, seperti curah hujan harian normal atau laba / rugi bulanan;
  • ketika nilainya mewakili distribusi populasi, yang berarti bahwa total area di bawah kurva mewakili ukuran total sampel, seperti kurva lonceng dari jumlah siswa dengan nilai yang berbeda (pada dasarnya histogram yang dihaluskan).

Idenya adalah bahwa, ketika membaca grafik, jika Anda mengambil dua titik pada sumbu x, area yang ditunjukkan di antara mereka harus mewakili jumlah aktual dari sesuatu yang terakumulasi dalam rentang itu. Untuk alasan ini, jika Anda nilai menyertakan jumlah negatif, saya sarankan menggunakan warna yang berlawanan untuk area negatif dan positif untuk menekankan bahwa mereka membatalkan total.

Kapan sebaiknya Anda tidak menggunakan grafik area?

  • ketika titik nol arbitrer (seperti pada suhu non-absolut, seperti kata @timcdlucas), tidak valid (seperti dalam pengukuran yang merupakan rasio dua nilai, seperti nilai tukar), atau tidak ditampilkan pada grafik untuk alasan ruang;
  • ketika nilai yang ditunjukkan oleh ketinggian garis sudah mewakili ukuran kumulatif, seperti total curah hujan hingga saat ini (untuk bulan / tahun) atau utang / tabungan;
  • ketika nilai-nilai mewakili posisi / nilai entitas yang berubah bukan akumulasi;
  • ketika Anda ingin membandingkan beberapa garis pada grafik yang sama (jika Anda tidak dapat melihat keseluruhan area, Anda kehilangan artinya - bandingkan grafik area secara berdampingan sebagai gantinya).

Dengan memperhatikan pedoman tersebut, grafik ping Anda dapat diartikan dua cara.

Di satu sisi, jika Anda menganggap kecepatan ping sebagai sebagai variabel tunggal yang berubah sepanjang hari, maka bagan garis sederhana akan paling tepat.

Di sisi lain, jika Anda membandingkan pola kecepatan ping harian dua jaringan yang berbeda (atau jaringan yang sama pada hari yang berbeda / periode waktu), maka mungkin Anda ingin menekankan jumlah total waktu yang diperlukan untuk tugas-tugas jaringan. Misalnya, jika grafik Anda memiliki beberapa puncak, bukan hanya satu, grafik garis akan menekankan variabilitas dalam kecepatan sementara grafik area akan menekankan penundaan total.

Bandingkan:
Grafik garis Grafik yang sama dengan area yang diisi
Total kumulatif sedikit lebih besar di paruh pertama grafik (kiri garis merah) daripada yang kedua, bahkan jika puncak mencapai nilai maksimum yang lebih tinggi di sebelah kanan. Mengisi menekankan bahwa blok padat di sebelah kiri, sehingga keseimbangan lebih baik terhadap puncak.

(Maafkan kualitas gambar yang buruk - tidak tahu cara mendapatkan R untuk melakukan grafik area! Harus mengekspor dan mengedit secara terpisah.)

AmeliaBR
sumber