Menampilkan data demografis secara efektif pada peta yang dicetak

29

Saya ingin memplot data per zona (total zona) berikut pada peta yang dapat dicetak / tidak interaktif:

  • Umur rata-rata
  • Pendapatan rumah tangga rata-rata
  • Jumlah rumah tangga
  • Kepadatan penduduk
  • Jumlah orang
  • Jumlah pekerja

Bagaimana Anda menampilkan 6 lapisan di atas secara efektif pada satu peta?

dassouki
sumber
1
Seberapa besar zona relatif terhadap ukuran halaman? Bisakah Anda memasukkan plot kecil di setiap zona? (misal grafik radar)
djq
@celenius - Ini adalah tipe survei sensus yang tipikal, di mana zona pusat kota jauh lebih kecil dari zona perumahan yang secara signifikan lebih kecil daripada zona pinggiran kota / pedesaan
dassouki
1
6 lapisan ini pada peta statis adalah pekerjaan desain yang sulit. Apa masalah yang mencegah penggunaan peta interaktif?
Trevesy
@Trevesy - untuk sebagian besar, persyaratannya adalah merancang peta yang dapat dicetak yang menyoroti 6 variabel untuk mempromosikan analisis visual
dassouki
1
Saya telah mengambil kebebasan untuk menambahkan tag visualisasi, merasa bebas untuk menghapusnya jika Anda merasa itu tidak pantas.
Andy W

Jawaban:

20

Saya akan mengatakan Anda tidak dapat memasukkan semua data pada satu peta dan membuatnya masuk akal. Saya akan merekomendasikan Anda berpikir di sepanjang garis prinsip Tufte tentang kelipatan kecil, memiliki beberapa peta lebih kecil dari area yang sama, masing-masing menggunakan variabel yang berbeda. Contoh: http://www.juiceanalytics.com/writing/better-know-visualization-small-multiples/

Meski begitu, Anda memiliki masalah bahwa Anda menggunakan banyak unit yang berbeda, jadi Anda memerlukan banyak kunci. Cara lain untuk melihat data (tetapi tidak di peta) adalah menggunakan tabel dengan semua nilai, berwarna (yaitu - warna berbeda untuk di bawah rata-rata, rata-rata, di atas rata-rata)

Saya sarankan Anda melihat sensus atlas untuk gagasan peta lainnya: http://www.census.gov/population/www/cen2000/censusatlas/

Mungkin dapat membantu untuk lebih merefleksikan pesan apa yang Anda coba komunikasikan, tepatnya (bukan hanya data apa yang Anda miliki).

neuhausr
sumber
5
+1 Ini jauh lebih baik daripada membuat kekacauan dengan mencoba melambangkan enam variabel sekaligus. Selain itu, mengapa tidak mencetak tabel data? Enam kolom + id, 30 baris: cukup kecil dan memberikan semua detail yang dibutuhkan siapa pun.
Whuber
13

Tidak mungkin untuk menunjukkan secara efisien begitu banyak data pada satu peta. Dua kemungkinan:

  • Menghasilkan 6 peta,

  • Analisis data Anda untuk mengklasifikasikan wilayah Anda, dan menampilkan hasil klasifikasi. Sebuah analisis komponen utama dapat membantu untuk menentukan korelasi yang paling penting dalam variabel Anda. Metode ini telah digunakan untuk menghasilkan peta sintetis ini:

teks alternatif

dari yang ini:

teks alternatif teks alternatif

Julien
sumber
Masalah dengan memiliki 6 peta adalah sulit menentukan secara visual tren apa pun. Terkadang, menyenangkan untuk melihat peta dengan banyak variabel dan melihat bagaimana segala sesuatunya berbaris
dassouki
2
@dassouki, untuk melihat bagaimana hal-hal berbaris Anda tidak perlu memetakannya. Bivariate scatterplots akan memenuhi kriteria itu, dan akan lebih mudah diinterpretasikan.
Andy W
3
The keuntungan dari memiliki 6 peta adalah bahwa hal itu mudah untuk visual mengidentifikasi tren! Saat Anda mencoba memadatkan enam (atau lebih) variabel ke dalam satu peta, akan sulit menemukan pola. (Namun, jika peta ini melibatkan ribuan fitur, saya akan mengubah pernyataan ini: jenis pemetaan tertentu, seperti visualisasi mesin terbang , dapat sangat efektif untuk menemukan pola dalam kumpulan data multivarian yang kaya: lmi.bwh.harvard.edu/papers/papers/ KindlmannTVCG2006.html )
whuber
@ Julien, Hal-hal keren, Anda mungkin tertarik dengan artikel ini yang baru saja saya temui, e-publications.org/ims/submission/index.php/AOAS/user/… , memiliki peta dengan analisis PCA terkait multi-variasi serupa data serta kode R untuk membuat plot.
Andy W
Sangat menarik, saya harus membaca tentang ini.
neuhausr
9

Saya setuju bahwa kelipatan kecil mungkin merupakan cara yang baik untuk mendekati masalah ini. Untuk melengkapi peta saya juga menyarankan matriks sebar variabel Anda, yang akan mengidentifikasi korelasi bivariat. Meskipun Anda kehilangan aspek geografis dari data Anda, jauh lebih mudah untuk memvisualisasikan hubungan antara variabel dalam sebar daripada membandingkan dua peta (bahkan berdampingan).

Jika Anda masih menginginkan semacam tren spasial ditangkap, Anda bisa memasukkan statistik spasial (seperti Moran's I) antara distribusi dan / atau variabel asli.

Sunting: Saya baru-baru ini menemukan beberapa pekerjaan meninjau kembali statistik Moral yang diterbitkan oleh Andre-Michel Guerry (awalnya pada tahun 1883) yang memiliki tujuan memvisualisasikan hubungan multi-variasi di ruang angkasa. Implementasi dari para penulis tersebut sangat mirip dengan apa yang telah disarankan dalam utas ini, kelipatan kecil, analisis komponen utama, matriks sebar plot, dan dalam diagram poligon. Terlampir adalah beberapa gambar dari A.-M. Statistik Moral Guerry di Prancis: Tantangan untuk Analisis Spasial Multivariabel oleh: Michael Friendly Statistics Science, Vol. 22, No. 3. (Agustus 2007), hlm. 368-399 ( PDF gratis). Juga artikel lain ( Dray dan Jombart, 2010 ) menganalisis data yang sama dan memiliki beberapa kode sumber dalam R untuk membuat plot tersebut.

Satu gambar adalah matriks sebar, yang lain adalah apa yang disebut diagram bintang (yang hanya cara yang berbeda untuk mewakili bagan batang seperti yang disarankan Pablo). teks alternatif teks alternatif

Andy W
sumber
8

Ini adalah contoh luar biasa dari kelipatan kecil yang diposting di Andrew Gelman (dan blog perusahaan) Pemodelan Statistik, Inferensial Kausal, dan Ilmu Sosial . Peta ini adalah dukungan pemilih untuk voucher sekolah oleh negara, tergantung pada pendapatan dan berbagai ras dan kategori agama. Orang kulit putih non-Injili benar-benar tidak suka voucher sekolah! (Jika Anda mengunjungi blog yang sebenarnya meskipun muncul dalam data survei 2004, mereka lebih mendukung voucher sekolah di antara kelompok itu). masukkan deskripsi gambar di sini

Andy W
sumber
Grafiknya keren, tetapi skala warnanya mengerikan. Mengapa 50% diprioritaskan, dengan menjadikannya abu-abu? Tentunya itu hanya menggunakan warna peta panas, atau sesuatu? Juga, mengapa hanya sedikit orang yang terpecah menjadi agama? tentu akan lebih masuk akal untuk berpisah berdasarkan ras dan kemudian dengan agama?
naught101
@ naught101, saya agak bingung dengan negativitas Anda. Tentunya abu-abu adalah deemphasized dibandingkan dengan warna yang lebih terang atau lebih gelap di kedua ujung spektrum. Sementara saya abivalen tentang perbedaan sewenang-wenang di 45%, IMO ketika membuat beberapa peta kecil seperti ini adalah buatan untuk memiliki nilai yang sangat kontras. Komentar tentang pemisahan agama / ras tidak masuk akal baik IMO. Ini adalah kategori yang jelas sangat terkait dengan apakah voucher dukungan indvidiual, dan sepertinya sebagian dari subset yang Anda sarankan tidak ada. cont ...
Andy W
Ya, saya sangat meragukan ada cukup banyak "Katolik Hitam" dalam survei untuk mengatakan sesuatu yang substantif tentang kelompok semacam itu (atau "Protestan Non-Evang Hispanik). Saya sarankan Anda membaca posting oleh Gelman dan mudah-mudahan itu akan menjernihkan motivasi untuk sub-kelompok
Andy W
mungkin hanya abu-abu tertentu yang menonjol di layar saya. Saya pikir itu akan lebih baik dengan putih, dan mungkin latar belakang abu-abu untuk membedakannya. Juga patut dicatat bahwa dua gambar di blog Gelman memiliki skala yang berbeda ... Saya mendapat kesan bahwa populasi kulit hitam jauh lebih tinggi, tetapi saya hanya melihat data sensus, dan berdiri dikoreksi. Satu hal yang aneh, adalah bahwa sensus mendefinisikan asal hispanik sebagai ortogonal untuk berlomba (ini adalah pertanyaan terpisah). Saya kira perbedaan Gelman didefinisikan secara berbeda ..
naught101
@ naught101 ini bukan info dari sensus, ini dari beberapa survei lain (sensus tidak punya pendapat umum tentang itu)
Andy W
5

Untuk memilih antara solusi yang disajikan di sini, Anda dapat memberikan dua informasi utama:

  • apa tujuan dari peta? (Temukan, Paparkan?)
  • apa yang dimaksud dengan publik peta? (Anda, sesama analis, perencana kota, publik?)

Solusi yang dikutip di sini mungkin memiliki efisiensi yang berbeda sesuai dengan tujuan dan publik.

Saya ingin menggeneralisasi jawaban Julien (satu peta sintetis dengan cara PCA) dengan mengutip teknik diagonalisasi matriks, yang dijelaskan oleh J. Bertin. Ini berguna ketika seseorang mencari sintesis semua informasi, daripada presentasi data lengkap.

Secara singkat, itu terdiri dalam mewakili setiap variabel dengan histogram, mengurutkan tumpukan histogram sedemikian rupa sehingga nilai-nilai (zona peta) disejajarkan dengan cara diagonal, untuk mendapatkan tipologi:

teks alternatif

(Sumber: http://books.google.com/books?id=2tlQAAAAMAAJ&dq=bertin%20graphique%20information&hl=fr&source=gbs_similarbooks )

Laurent Jégou
sumber
4

Itu banyak informasi dan fakta bahwa satu peta yang menggabungkan semuanya dengan cara tematis akan menghasilkan presentasi yang tidak berguna karena polusi visual. Di sisi lain ada 30 zona, jadi, banyak peta untuk setiap zona akan menghasilkan polusi juga.

Solusi saya: Pilih yang mana yang merupakan informasi paling penting, katakanlah 'pendapatan rumah tangga', lalu zonakan peta dalam beberapa kategori pendapatan. Dan akhirnya untuk setiap tempat penghasilan, plot bar obrolan dengan 5 atribut lainnya.

Dengan peta itu dapat membuat beberapa perbandingan seperti, misalnya: "Daerah berpenghasilan tinggi selalu menunjukkan jumlah pekerja yang besar dan usia rata-rata lebih dari 21 tahun".

Lihat contohnya ...

teks alternatif

Pablo
sumber
4

Mungkin beberapa dari ide ini dapat membantu?

Dengan asumsi Anda memiliki enam dimensi:

1: Choropleth : Contoh pendapatan rumah tangga 0

2, 3, dan 4: Simbol : Mewakili jumlah orang sebagai titik, yang memungkinkan Anda melihat latar belakang: contoh 1, contoh 2 menggunakan skala abu-abu untuk pekerja / non-pekerja dan skema warna yang berbeda untuk menunjukkan usia

5: 3D : Menggunakan kepadatan populasi sebagai contoh medan 3

6: (Aku tidak bisa memikirkan cara ke-6!)

Apakah berlebihan untuk menunjukkan 'Jumlah rumah tangga', 'Kepadatan populasi' dan 'Jumlah orang'?

Saya akan skeptis jika peta dengan kompleksitas ini akan jelas bagi siapa pun selain Anda. Jika saya mempresentasikannya, saya akan menunjukkan masing-masing elemen secara terpisah terlebih dahulu, dan kemudian menambahkannya sehingga audiens dapat memahami langkah-langkahnya.


Salah satu cara alternatif (jika Anda tidak memiliki ruang untuk grafik radar untuk setiap zona, bisa dengan membuat 'mesin terbang' yang mewakili contoh informasi ini 4, gambar 10.28 . Saya pikir ini biasanya sulit dipahami, dan tidak mudah untuk mendesain jelas, tetapi contoh terkait dapat digunakan dalam kasus ini.


Pikiran lain yang saya miliki, adalah untuk mengekstraksi poligon dengan ketinggian yang sama untuk setiap poligon, dan kemudian menggunakan bagian ketinggian untuk mewakili parameter ini. Mirip dengan membuat bagan batang untuk setiap area, tetapi di mana setiap bagian dilapisi di atas pada interval yang sama. Ini perlu dilihat dari 3D yang berarti sebagian akan dikaburkan.

djq
sumber
Saya suka, dan saya maksud semua saran Anda. Saya berencana menerapkan 1-> 4. Namun, untuk hal-hal 3d: Saya menemukan bahwa ketika Anda melakukan peta 3d, area pusat kota, biasanya terletak di pusat mendapatkan sebagian besar ketinggian, memblokir banyak zona di belakangnya
dassouki
@dassouki - Saya setuju itu biasanya terjadi. Mungkin Anda bisa menggunakan variabel yang tidak memiliki rentang besar untuk ini (usia rata-rata?), Atau jika ya, Anda bisa mengubahnya secara logaritma.
djq
3
@celenius Pertanyaan menarik tentang kemungkinan redundansi: kepadatan populasi adalah jumlah orang relatif terhadap wilayah ; jumlah orang adalah jumlah absolut ; dan jumlah rumah tangga memberikan informasi tentang bagaimana orang hidup bersama. Meskipun jelas ketiga variabel ini saling terkait (dan dapat membuat masalah hampir kolinearitas dalam regresi), mereka sebenarnya adalah tiga bagian informasi yang berbeda. BTW, ini "choropleth". (Untungnya Google mengenali kesalahan ketik ini dan tetap melakukan pencarian yang dimaksud.)
whuber
1
@whuber - Saya pikir itu mungkin dilakukan menggunakan flash (sedih!).
djq
2
Saya sangat curiga tentang saran 3D. AFAIK tidak ada yang menunjukkan 3D sangat bermanfaat. Tautan ke kejahatan San Fran bekerja tetapi hanya karena sangat sederhana - pola yang lebih kompleks akan sulit untuk diuraikan. Saya tidak berpikir 3D adalah cara untuk pergi sama sekali dalam hal ini.
Trevesy
2

Ini adalah tugas yang menantang. Jawaban saya adalah dengan peta multivarian. Lihat peta ini . Peta akan terlihat sibuk jika Anda menunjukkan semua variabel pada satu peta. Pastikan Anda memilih skema warna yang sesuai jika Anda memilih untuk pergi dengan peta multivarian.

Raj
sumber
Google Documents dicekal tempat saya bekerja :(
dassouki
tidak bekerja dengan baik dan saya tidak dapat mengikisnya jika tidak memiliki ekstensi file di akhir
dassouki
Masih tidak jalan ....
dassouki
Ini adalah blok dari sisiku. :( Saya tidak keberatan mengirimi Anda peta melalui email.
Raj
0

Satu derajat penyederhanaan adalah mengekspresikan satu item, seperti kepadatan populasi, melalui kartogram, yaitu mendistorsi area setiap unit sehingga proporsional dengan populasi:

Pemilihan Presiden AS 2008
(sumber: amherst.edu )

Kelemahan utama adalah bahwa pemirsa harus dapat mengenali distorsi zona dari bentuk "biasa" mereka.

Info lebih lanjut di sini: http://gis.amherstma.gov/data/SpringNearc2009/Session4Cartograms.pdf

Andy
sumber
1
Saya pikir ini memiliki potensi, tetapi tidak jelas seberapa baik kartogram dapat diterapkan pada situasi khusus ini (secara bersamaan melihat beberapa atribut pada ruang yang sama). Secara teoritis Anda bisa membuat banyak banyak kartogram kecil, tetapi mungkin sulit untuk menafsirkannya (Anda kehilangan konsistensi antara peta, yang merupakan jenis esensial untuk kelipatan kecil). Mungkin kartogram dapat dikombinasikan dengan warna dengan cara yang lebih menarik untuk menunjukkan banyak atribut.
Andy W
1
Contoh beberapa kartogram kecil, gisandscience.com/2011/12/12/07/...
Andy W