Haruskah saya menggunakan skala diskrit atau kontinu untuk mewarnai kloropleth?

8

Saya membuat choropleth untuk balapan lokal mendatang menggunakan D3 . Ada dua kandidat yang mencalonkan diri dalam pemilihan. Untuk setiap poligon yang diberikan pada peta saya, jika kandidat merah memiliki lebih banyak suara, warnanya harus merah. Jika kandidat biru memiliki lebih banyak suara, warnanya harus biru. Jika kandidat biru menang banyak, warnanya harus biru lebih dalam. Jika kandidat merah menang banyak, warnanya harus merah lebih dalam.

Haruskah saya menggunakan skala diskrit atau kontinu untuk ini? Artinya, saya harus membuat ramp warna dari merah ke biru untuk saturasi atau intensitas yang diberikan. Atau haruskah saya membuat nampan sehingga jika merah / biru jatuh dalam kisaran tertentu, poligon diberikan salah satu dari beberapa warna? Dari tutorial, sepertinya kebanyakan orang menghasilkan sampah.

bernie2436
sumber
Cari juga topik kartografi / peta warna bivariat , untuk berjaga-jaga jika Anda menginginkan lebih banyak ide tentang teknik yang Anda pilih.
Martin F
Data yang seimbang (dua kategori, peningkatan dalam satu selalu berarti penurunan yang lain), dapat dipahami sebagai variabel tunggal. Karena dalam banyak pemilihan, mayoritas suara adalah untuk dua kandidat (bahkan jika ada lebih dari dua kandidat dalam perlombaan), kenaikan untuk satu adalah penurunan untuk yang lain. Karenanya, ini tidak perlu dianggap sebagai peta bivariat.
Lee Hachadoorian

Jawaban:

13

Ada beberapa manfaat dan kelemahan dari setiap cara melakukannya. Untuk membuat cerita panjang pendek, saya akan merekomendasikan membuat "tempat sampah." Beberapa catatan untuk membantu Anda memilih, dan tentang merancang choropleth secara umum:

Pemetaan langsung dari nilai data ke warna (peta 'tidak berbaris') dapat dianggap sebagai cara paling akurat untuk menampilkan data, namun peta yang diklasifikasi (peta dengan 'tempat sampah') dapat lebih terbaca karena beberapa alasan.

Jika Anda menggunakan peta yang tidak diklasifikasi dan datanya miring, atau ada outlier dalam kumpulan data, outlier akan menonjol dengan jelas, sementara banyak poligon dapat berakhir dengan warna yang sangat mirip. Ini akan menyoroti fakta bahwa beberapa area secara radikal berbeda dari yang lain (dalam kasus Anda, jika beberapa area memiliki preferensi yang jauh lebih besar untuk satu kandidat daripada yang lain), tetapi lebih sulit untuk membedakan hubungan dalam sisa area peta.

Dalam peta yang dikelompokkan, masing-masing kelas harus berbeda secara visual, sehingga mudah untuk mengetahui di mana suatu daerah terletak pada data, dengan mengorbankan beberapa perbedaan yang lebih baik yang hilang.

Masalah lain adalah bahwa persepsi intensitas warna tidak sepenuhnya linier. Jadi, jika Anda memiliki ramp warna dari putih ke biru, yang sesuai dengan tidak ada kandidat yang menerima lebih banyak suara untuk lead maksimum untuk satu kandidat, warna yang 75% dari jalan antara putih dan biru mungkin tidak dianggap sebagai 75% dari jalan antara dua warna, dan oleh karena itu pengguna peta akan membuat asumsi yang salah tentang nilai data yang diwakilinya.

Peta yang diklasifikasi, di sisi lain, dapat memiliki warna dari masing-masing kelas yang dipilih dengan cermat untuk dirasakan secara jelas dan berbeda. Saya tidak cukup tahu untuk mendesain satu set warna yang melakukan ini, tetapi Cynthia Brewer dan Mark Harrower melakukannya, dan mereka menciptakan colorbrewer2.org , alat hebat (gratis) untuk membantu kartografer memilih skema warna yang bagus untuk peta mereka. Anda dapat memilih dari berbagai skema, memilih jumlah kelas, dan itu memberikan pratinjau seperti apa skema tersebut dalam praktiknya, dan nilai RBG, HEX, atau CMYK untuk setiap warna dalam skema. Sangat berguna, dan cukup menyenangkan untuk dimainkan.

Untuk alasan ini, saya akan merekomendasikan membuat peta berkelas. Jumlah kelas yang direkomendasikan biasanya angka ganjil dari 5-9 atau lebih. Menggunakan angka ganjil memberikan nilai rata-rata yang berbeda, dan jumlah kelas ini umumnya dianggap cukup untuk memberikan perbedaan yang berguna dalam data, tetapi tidak terlalu banyak sehingga tidak bisa dibedakan. Karena Anda menggunakan skema warna yang berbeda (warna terang di tengah, dua warna berbeda di setiap ujungnya), Anda bisa lolos dengan lebih banyak kelas, mungkin 7-9.

Pergi ke colorbrewer, pilih "diverging" untuk sifat data Anda, pilih skema warna merah ke biru, pilih jumlah kelas Anda, dan pergi!

Untuk sebagian besar dari ini, tidak ada aturan yang sulit. Standarnya adalah, "apakah peta mengomunikasikan data dengan baik?" Bermain-main dengan parameter sampai Anda mendapatkan sesuatu yang "berfungsi" bisa menjadi hal yang baik.

Sekarang, catatan tentang membuat choropleths. Saya minta maaf jika ini alasan yang akrab bagi Anda:

Suatu hal yang menarik ketika menggunakan peta yang dikelompokkan adalah bagaimana data dibagi menjadi kelas-kelas. Apakah rusak pada interval yang sama di sepanjang rentang? Apakah sejumlah titik data tertentu ditugaskan untuk setiap kelas? Sejumlah standar deviasi dari mean? Apakah rusak pada jeda "alami" dalam data? Metode mana yang Anda gunakan membuat perbedaan dalam bagaimana data digambarkan. Saya tidak banyak programmer, dan saya tidak yakin metode mana yang Anda gunakan untuk menggunakan skrip. "Istirahat alami" biasanya merupakan pilihan yang baik. Untuk data dengan titik tengah yang jelas seperti data polling (titik tengah menjadi perpecahan 50/50), standar deviasi dapat berguna.

Saat membuat choropleth, ada baiknya menggunakan data yang terstandarisasi pada satu unit area. Misalnya, daripada menggunakan total populasi di suatu daerah, lebih baik memetakan populasi per mil persegi di setiap daerah. Alasannya adalah bahwa area yang lebih besar akan cenderung memiliki lebih banyak orang di dalamnya daripada yang lebih kecil, sehingga membaginya dengan area setiap unit yang dipetakan memberikan gambaran tren yang lebih akurat. Data juga dapat distandarisasi sebagai persen. Misalnya, tingkat kemiskinan daripada sejumlah orang dalam kemiskinan.

Untuk keperluan Anda, lebih jelas untuk memetakan persentase suara yang diberikan untuk seorang kandidat daripada jumlah suara yang diberikan untuk kandidat itu.

Bagaimanapun, saya berharap beberapa dari ini berguna, dan bahwa peta Anda ternyata baik!

Untuk sebagian besar diskusi ini saya menggunakan Kartografi Tematik dan Geovisualisasi oleh Slocum et al.

bakern
sumber
Warna diskrit per-kapita NYT sangat mengerikan akhir-akhir ini. Begitu banyak detail yang hilang karena nampan warnanya sangat besar. Saya pikir ini adalah contoh di mana skala warna kontinu harus digunakan.
Andy
(yang coronavirus peta itu)
Andy
5

Anda membahas salah satu dari banyak aspek simbolisasi : cara menggambarkan nilai-nilai kuantitatif melalui representasi warna variabel - menggunakan skala saturasi atau intensitas warna diskrit atau kontinu. Pertanyaan bagus. Jawabannya adalah, seperti sering, itu tergantung ...

Kartografi tematis tradisional mengakui bahwa peta, sebagai model realitas yang disederhanakan, adalah produk dari banyak generalisasi. Untuk mudahnya, jumlah yang dikelompokkan ke dalam kelas (sampah) - dan ada banyak diskusi tentang seberapa banyak kelas seperti harus ada (5 atau 7 sering disebut-sebut). Keuntungan: lebih mudah dibangun menggunakan metode foto-mekanis tradisional, dan lebih mudah menyampaikan pesan. Lihat, di sini Red Ken disukai, sementara di sana, Blue Peter.

Kartografi tematis kontemporer memungkinkan peta dengan detail yang jauh lebih besar di mana kuantitas kontinu dapat diwakili oleh skala warna dari rentang yang sangat tinggi. Keuntungan: lebih objektif dan terperinci. Pembaca peta berpotensi membuat ulang sumber data dengan lebih presisi.

Jadi, apa tujuan yang lebih dalam dari peta Anda?

Apakah Anda ingin lebih objektif, menjelajahi variasi detail yang ada dalam data? Gunakan skala warna kontinu. Konsep "peta sebagai alat investigasi" ini dilengkapi dengan nama (baru) seperti "visualisasi data" dan "pemetaan panas".

Apakah Anda ingin menceritakan kisah sederhana? Gunakan skala warna diskrit. Ini adalah "peta sebagai alat komunikasi".

Karena peta Anda sudah sangat digeneralisasi secara spasial, menjadi wilayah pemungutan suara, saya mungkin menyarankan menggunakan skala warna kontinu sebagai kompromi - Anda memiliki diskritisasi spasial tetapi kontinuitas statistik. Hanya sebuah ide.

Pada akhirnya, terserah Anda. Mengapa tidak bereksperimen dengan beberapa variasi?

Martin F
sumber
Saya pikir jika sejarah visualisasi telah dimulai dengan komputer modern daripada pencetakan murah dengan jumlah warna tinta yang terbatas, orang akan lebih cenderung menggunakan skala warna terus menerus.
Andy
1

Saya melihat dua Opsi:

a) Anda hanya menggunakan nampan: (angka hanyalah sebuah contoh)

  • Kandidat Merah memiliki> 50% - 70% suara -> warna merah terang
  • Kandidat Merah memiliki> 70% suara -> warna merah tua
  • untuk biru sesuai

b) Anda menggunakan Color ramp.

  • colorramp kontinu dari merah muda / biru ke merah tua / biru dengan pemetaan nilai dari> 50% hingga 100% ke warna terang ke merah / biru tua.

Apa yang Anda Pilih tergantung pada apa yang ingin Anda komunikasikan dengan peta. Jika info "menang" dan "menang dengan xy%" sudah cukup, Pilih a). Jika Pembaca Anda dapat memperkirakan berapa banyak% kandidat merah atau biru yang memimpin, pilih b)

Chris P.
sumber