Ini adalah pertanyaan visualisasi data - Saya harap tidak ada masalah untuk menanyakannya di sini.
Kapan tepat menggunakan isian di bawah grafik garis untuk rangkaian waktu, seperti grafik di bawah ini? (yang menampilkan waktu ping lebih dari sehari)
Saya kira lebih umum menggunakan garis polos, tanpa isian di bawahnya, tetapi apakah boleh menggunakan isian untuk variasi visual?
Saya akan sangat tertarik mengetahui tentang penelitian persepsi tentang topik ini, atau panduan gaya.
data-visualization
Richard
sumber
sumber
0s
batas bawah alami dan Anda menunjukkannya, lalu mengapa tidak?Jawaban:
Ada sedikit seni untuk menyeimbangkan aspek estetika dan informatif dari grafik. Konsultan / penulis visualisasi terkemuka seperti Edward Tufte dan Stephen Few memilih estetika minimal yang menghindari gangguan dari bagian informatif grafik. Namun, untuk beberapa audiens sejumlah kecil dibenarkan - lihat aplikasi visualisasi data jurnalistik Alberto Cairo, misalnya.
Sudut penelitian persepsi adalah bahwa setiap elemen grafis mengkomunikasikan pesan, beberapa yang tidak kita sadari karena korteks visual kita berurusan dengannya (" pemrosesan sebelum perhatian "). Elemen tambahan, bahkan yang berlebihan, dapat menghasilkan pemrosesan ekstra. Grafik yang sesuai tergantung pada pesan yang akan dikomunikasikan dan audiens.
Untuk pertanyaan spesifik Anda, garis terhubung menekankan tren (dan variasi dari tren). Area yang diisi menekankan penyimpangan dari baseline. Bagan batang atau bagan jarum akan menekankan peristiwa terpisah yang menyimpang dari garis dasar.
Konteks grafik juga penting. Jika Anda memiliki kisi-kisi grafik yang sangat padat, isian akan membantu mengaitkan setiap baris dengan garis dasarnya.
Akhirnya, pertimbangan lain untuk menambahkan elemen grafis berlebihan / florish adalah membuatnya lebih sulit untuk memperpanjang grafik dengan elemen yang lebih informatif. Misalnya, Anda mungkin ingin menyorot nilai khusus, overlay garis tren lain atau overlay band, seperti pada mock-up berikut.
sumber
Beberapa hal lagi yang perlu dipertimbangkan:
Seperti disebutkan dalam komentar, underfill sebagian besar tidak pantas jika sumbu x tidak pada titik nol y alami. Ini mungkin karena sumbu y diskalakan untuk mulai pada angka selain nol, atau karena unit yang digunakan tidak memiliki interpretasi nol alami (misalnya Kelvin memiliki nol alami, sedangkan Celsius tidak.)
Kedua, kasus ketika underfill sangat valid adalah jika data itu sendiri dapat dianggap kurang diisi. Misalnya, bagan garis ketinggian gunung masuk akal untuk kurang diisi, warna isi mewakili bumi, sedangkan tidak terisi mewakili udara.
Contoh terkait mungkin menghitung data. Jika kita menumpuk semua individu di setiap titik x, kita akan mendapatkan diagram batang. Jika interpolasi antara bar masuk akal kita akan berakhir dengan bagan garis dengan isi yang kurang.
Gambar ini dari 'tampilan visual informasi kuantitatif' Mungkin menjelaskannya sedikit lebih baik. Ini menunjukkan unit militer mana yang berada di Eropa selama perang kedua (saya pikir). Menumpuk unit pada setiap titik waktu memberi Anda bagan batang yang kurang terisi. Menggambar garis dari atas data memberi Anda bagan garis yang kurang terisi.
sumber
Dua jawaban sebelumnya mencakup poin-poin penting utama, tetapi ada beberapa hal yang masih harus disebutkan.
Pertama, saya harus mengatakan bahwa saya tidak setuju dengan pendekatan minimalis ekstrim untuk grafik - bahwa semua tinta yang berlebihan harus hilang. Variasi yang mengganggu dan tidak berarti harus pergi. Tetapi area padat versus satu garis dapat menangkap mata lebih baik dan berkomunikasi lebih banyak dalam sekejap. Dan seperti yang Anda katakan, itu dapat menambahkan "variasi visual".
Namun, seperti yang ditunjukkan oleh @xan, pandangan sekilas itu juga menginterpretasikan area secara berbeda dari garis, dengan cara yang sebagiannya tidak disadari.
Grafik area menyiratkan jumlah total yang terakumulasi saat Anda melanjutkan sepanjang sumbu x. Jika Anda membandingkan dua grafik, dan satu memiliki area yang lebih besar diisi, pandangan Anda akan memberi tahu Anda bahwa itu memiliki total yang lebih besar terlepas dari nilai awal dan akhir.
Sebaliknya, grafik garis menunjukkan nilai yang berubah. Fokusnya adalah pada perubahan posisi dari satu titik ke titik berikutnya, bukan pada total akumulasi.
Jadi kapan Anda harus menggunakan grafik area?
Idenya adalah bahwa, ketika membaca grafik, jika Anda mengambil dua titik pada sumbu x, area yang ditunjukkan di antara mereka harus mewakili jumlah aktual dari sesuatu yang terakumulasi dalam rentang itu. Untuk alasan ini, jika Anda nilai menyertakan jumlah negatif, saya sarankan menggunakan warna yang berlawanan untuk area negatif dan positif untuk menekankan bahwa mereka membatalkan total.
Kapan sebaiknya Anda tidak menggunakan grafik area?
Dengan memperhatikan pedoman tersebut, grafik ping Anda dapat diartikan dua cara.
Di satu sisi, jika Anda menganggap kecepatan ping sebagai sebagai variabel tunggal yang berubah sepanjang hari, maka bagan garis sederhana akan paling tepat.
Di sisi lain, jika Anda membandingkan pola kecepatan ping harian dua jaringan yang berbeda (atau jaringan yang sama pada hari yang berbeda / periode waktu), maka mungkin Anda ingin menekankan jumlah total waktu yang diperlukan untuk tugas-tugas jaringan. Misalnya, jika grafik Anda memiliki beberapa puncak, bukan hanya satu, grafik garis akan menekankan variabilitas dalam kecepatan sementara grafik area akan menekankan penundaan total.
Bandingkan:
Total kumulatif sedikit lebih besar di paruh pertama grafik (kiri garis merah) daripada yang kedua, bahkan jika puncak mencapai nilai maksimum yang lebih tinggi di sebelah kanan. Mengisi menekankan bahwa blok padat di sebelah kiri, sehingga keseimbangan lebih baik terhadap puncak.
(Maafkan kualitas gambar yang buruk - tidak tahu cara mendapatkan R untuk melakukan grafik area! Harus mengekspor dan mengedit secara terpisah.)
sumber