Saya tidak bagus dalam statistik, tetapi saya pikir saya telah datang ke tempat yang tepat. Pertanyaan saya sederhana:
Masalah saya terdiri dari membandingkan populasi beberapa negara bagian di negara kecil, tetapi beberapa negara bagian memiliki populasi 3000.000 dan beberapa populasi 2.000.
Saya melukisnya di peta, dan "intensitas" warna tergantung pada bagaimana populasi setiap negara dibandingkan dengan populasi seluruh negara.
Masalahnya adalah bahwa negara bagian dengan banyak populasi ditunjukkan dengan warna yang sangat intens dan negara bagian yang kecil hampir tidak memiliki warna.
Apakah ada cara mudah untuk "menormalkan" atau membuat data dapat dibandingkan?
Saya tidak tahu apakah saya menjelaskan diri saya dengan benar tetapi saya berharap seseorang dapat membantu saya. Berikan komentar jika pertanyaan saya tidak jelas dan saya akan mengklarifikasi.
Terima kasih untuk bantuannya!
sumber
Jawaban:
Maaf, tetapi bagi saya sepertinya Anda mencoba memperbaiki apa yang tidak rusak. Bahkan, Anda mungkin bahkan mencoba untuk memecahkan apa yang tidak rusak. Ketika Anda memiliki variabel kuantitatif (di sini, populasi) yang mencakup rentang yang luas, maka metrik apa pun yang Anda gunakan untuk mewakili itu juga harus menjangkau rentang yang luas.
Tetapi untuk semua hal yang berkaitan dengan warna (dan terutama peta), sumber kuncinya adalah, saya pikir ColorBrewer
sumber
Pertanyaan bagus, Salah satu solusinya adalah mengubah skala warna agar terdistribusi secara lebih seragam, atau distribusi dengan ekor lebih rendah ... tetapi legenda Anda harus cukup jelas karena mendeformasi skalanya, entah bagaimana, tidak adil ...
Misalnya, dalam R, mengubah ukuran normal menjadi seragam. (apa yang Anda miliki mungkin lebih ke arah lain karena Anda memiliki ekor besar dan Anda ingin mereka lebih kecil, tetapi prinsipnya sama)
sumber
Anda dapat membaginya dengan total populasi. Ini akan memastikan bahwa semuanya berada di antara 0 dan 1. Jika skala masih terlalu berlainan, pertimbangkan skala log.
sumber
Saya merasa canggung menanyakannya, tetapi apakah Anda benar-benar berkomitmen untuk menggunakan warna untuk menggambarkan jumlah kuantitatif? Apakah tidak ada cara untuk meletakkan bilah di setiap negara bagian, yang tingginya mewakili kuantitas?
Cara lain mungkin untuk menunjukkan peta dengan area yang mewakili area geografis, bersama dengan peta di mana area masing-masing negara bagian sebanding dengan ukuran populasi - mirip dengan bagaimana homunculus sensorik . Tapi itu akan menjadi jumlah gambar yang menyakitkan - saya tidak tahu cara apa pun untuk mengotomatisasi itu (meskipun mungkin ada)
sumber
Tujuan Anda yang dinyatakan:
Masalah yang Anda nyatakan:
Tujuan menormalkan data Anda sebelum pemetaan
Jawaban ini akan kurang karena saya tidak yakin konteks mengapa Anda membuat peta.
Namun demikian, berikut adalah beberapa pemikiran untuk dijelajahi: Normalisasi data Anda sehingga peta memberikan makna yang menarik bagi pembaca potensial peta, sehingga mereka dapat menghubungkan apa yang mereka lihat di peta Anda dengan beberapa konsep yang biasanya mereka pikirkan. Pada dasarnya, saya pikir angka-angka normalisasi baru Anda harus dikaitkan dengan beberapa konsep kualitatif yang menurut pembaca menarik untuk dipahami (tidbit acak: Ukur = Kuantitas x Kualitas, Hegel).
Dua cara yang diusulkan untuk menormalkan data Anda
1. Untuk memberi gambaran tentang seberapa banyak ruang terbuka di setiap negara bagian.
Buat variabel status baru untuk kepadatan populasi dengan menghitung populasi dibagi dengan total area negara.
2. Untuk membuat pewarnaan dari negara-negara kontras satu sama lain.
Buat variabel status baru dengan menghitung penyimpangan dari rata-rata setiap status. Misalnya, Anda memiliki 3 negara bagian dengan populasi sebagai berikut:
Rata-rata sekitar 50.
Nilai variabel baru untuk setiap negara bagian adalah sebagai berikut:
Anda dapat menggunakan skema warna apa pun di mana angka positif kontras dengan angka negatif (google 'colorbrewer' untuk banyak contoh skema warna untuk peta).
sumber