Saya membuat grafik untuk menunjukkan tren tingkat kematian (per 1000 ppl.) Di berbagai negara dan kisah yang harus berasal dari plot adalah bahwa Jerman (garis biru muda) adalah satu-satunya yang trennya meningkat setelah 1932. Ini adalah percobaan (dasar) pertama saya
Menurut pendapat saya, grafik ini sudah menunjukkan apa yang ingin kita katakan tetapi tidak super intuitif. Apakah Anda punya saran untuk membuatnya lebih jelas bahwa perbedaan di antara tren? Saya berpikir untuk merencanakan tingkat pertumbuhan tetapi saya mencoba dan itu tidak lebih baik.
Data adalah sebagai berikut
year de fr be nl den ch aut cz pl
1927 10.9 16.5 13 10.2 11.6 12.4 15 16 17.3
1928 11.2 16.4 12.8 9.6 11 12 14.5 15.1 16.4
1929 11.4 17.9 14.4 10.7 11.2 12.5 14.6 15.5 16.7
1930 10.4 15.6 12.8 9.1 10.8 11.6 13.5 14.2 15.6
1931 10.4 16.2 12.7 9.6 11.4 12.1 14 14.4 15.5
1932 10.2 15.8 12.7 9 11 12.2 13.9 14.1 15
1933 10.8 15.8 12.7 8.8 10.6 11.4 13.2 13.7 14.2
1934 10.6 15.1 11.7 8.4 10.4 11.3 12.7 13.2 14.4
1935 11.4 15.7 12.3 8.7 11.1 12.1 13.7 13.5 14
1936 11.7 15.3 12.2 8.7 11 11.4 13.2 13.3 14.2
1937 11.5 15 12.5 8.8 10.8 11.3 13.3 13.3 14
data-visualization
PhDing
sumber
sumber
Jawaban:
Terkadang lebih sedikit lebih banyak. Dengan sedikit detail tentang variasi tahun ke tahun dan perbedaan negara Anda dapat memberikan informasi lebih lanjut tentang tren. Karena negara-negara lain sebagian besar bergerak bersama, Anda dapat bertahan tanpa warna terpisah.
Dalam menggunakan yang lebih halus, Anda membutuhkan pembaca untuk percaya bahwa Anda belum merapikan variasi yang menarik.
Perbarui setelah mendapatkan beberapa permintaan untuk kode :
Saya membuat ini di Graph Builder interaktif JMP . Skrip JMP adalah:
));
sumber
Ada jawaban yang bagus di sini. Biarkan saya membawa Anda pada kata Anda bahwa Anda ingin menunjukkan bahwa tren untuk Jerman berbeda dari yang lain. Level vs perubahan adalah perbedaan umum dalam ekonomi. Data Anda ada di level , tetapi pertanyaan Anda dinyatakan mencari perubahan . Cara untuk melakukannya adalah dengan menetapkan level referensi (di sini 1932) sebagai . Dari sana, setiap tahun berturut-turut adalah sebagian kecil dari tahun sebelumnya. (Adalah umum untuk mengambil log untuk membuat perubahan lebih stabil dan simetris. Ini memang mengubah arti angka yang tepat, jika Anda benar-benar ingin seseorang mendapatkan itu dari plot, tetapi biasanya untuk hal semacam ini, orang ingin menjadi dapat melihat polanya.) Anda kemudian mendapatkan jumlah lari untuk setiap seri dan kalikan dengan100 1001 100 dengan perjanjian. Itu yang kau plot. Kasing Anda sedikit kurang umum karena titik referensi Anda ada di tengah-tengah seri Anda, jadi saya menjalankan ini di kedua arah dari tahun 1932. Di bawah ini adalah contoh sederhana, dikodekan dalam R (akan ada banyak cara untuk membuat kode dan plot lebih bagus, tetapi ini harus menunjukkan ide secara langsung). Saya membuat garis untuk Jerman lebih tebal untuk membedakannya dalam legenda, dan saya menambahkan garis referensi pada . Sangat mudah untuk melihat bahwa Jerman menonjol dari yang lain. Anda juga dapat melihat bahwa semua negara lain berakhir dengan tingkat yang lebih rendah pada 1937 dari 1932, dan bahwa perubahan tahun demi tahun mereka berfluktuasi jauh lebih sedikit di tahun-tahun setelah 1932 daripada di tahun-tahun menjelang itu. 100
Sebaliknya, di bawah ini adalah plot data yang sesuai di tingkat. Meskipun demikian, saya mencoba membuatnya mungkin untuk melihat bahwa Jerman sendiri naik setelah tahun 1932 dalam dua cara: Saya menempatkan titik yang menonjol pada setiap seri pada tahun 1932, dan menggambar garis abu-abu samar di plot di latar belakang di tingkat-tingkat tersebut.
sumber
Ada banyak ide bagus di sini dalam jawaban lain, tetapi mereka tidak menghabiskan solusi bagus yang mungkin. Grafik pertama dalam jawaban ini menyatakan bahwa berbagai tingkat kematian dapat didiskusikan dan dijelaskan secara terpisah. Dengan memungkinkan setiap seri mengisi banyak ruang yang tersedia, ini memusatkan perhatian pembaca pada pola perubahan relatif.
Urutan alfabetis menurut negara biasanya merupakan standar bodoh, dan tidak ditekankan di sini. Untungnya, dan untungnya, Jerman sebagai de berada di tengah layar 3 x 3 ini. Sebuah narasi sederhana - Lihat! Pola Jerman luar biasa dengan peningkatan dari tahun 1932 - dimungkinkan dan masuk akal.
Kebetulan, tapi untungnya, 9 negara cukup untuk membenarkan mencoba panel terpisah, tetapi tidak terlalu banyak untuk membuat desain itu tidak praktis (misalnya 30 dan 300 panel, mungkin ada terlalu banyak panel untuk dipindai, masing-masing terlalu kecil untuk melakukan itu). diteliti dengan cermat).
Jelas, ada banyak ruang di sini untuk nama negara yang lebih lengkap. (Dalam beberapa jawaban lain, legenda memakan sebagian besar dari ruang yang tersedia, namun tetap sedikit samar. Dalam praktiknya, orang-orang yang tertarik pada data semacam itu akan menemukan bahwa singkatan negara mudah untuk diterjemahkan, tetapi seberapa jauh legenda itu dibutuhkan sering kali merupakan masalah menjengkelkan dalam desain grafis.)
Kode stata untuk catatan:
SUNTING:
Salah satu peningkatan sederhana dari grafik ini yang disarankan oleh Tim Morris adalah untuk menyoroti tahun di mana maksimum terjadi:
EDIT 2 (direvisi untuk menunjukkan kode yang lebih sederhana):
Atau, desain berikutnya ini menunjukkan setiap seri secara terpisah, tetapi setiap kali dengan seri lainnya sebagai latar belakang. Ide umum dibahas dalam utas terkait ini .
Ada kerugian dan juga untung di sini. Sementara setiap seri dapat lebih mudah dilihat dalam konteks yang lain, ruang hilang oleh pengulangan.
Kode stata untuk catatan:
(Kode untuk
input
,reshape
,rename
seperti di atas dalam jawaban ini)fabplot
harus dipahami sebagai rontf
atauf
oregrounda
danb
ackdrop atau ackgroundb
plot, bukan sebagai gema dari tahun 1960-an gaul untuk "luar biasa".sumber
year
sebagai judul sumbu x (siapa yang butuh itu?). Saya akan menambahkan itu ke pengguna Stata struktur data alami akan menjadi yang tidak mewajibkanrename
danreshape
. tetapi memiliki panel yang berbeda (di sini negara) sebagai blok pengamatan yang berbeda.Grafik Anda masuk akal, tetapi akan memerlukan beberapa penyempurnaan, termasuk judul, label sumbu, dan label negara lengkap. Jika tujuan Anda adalah untuk menekankan fakta bahwa Jerman adalah satu-satunya negara dengan kenaikan angka kematian selama periode pengamatan maka cara sederhana untuk melakukannya adalah dengan menyoroti garis ini di plot, baik dengan menggunakan garis yang lebih tebal, berbeda tipe garis, atau transparansi alfa. Anda juga bisa menambah plot deret waktu Anda dengan plot batang yang menunjukkan perubahan tingkat kematian dari waktu ke waktu, sehingga kompleksitas garis deret waktu dikurangi menjadi satu ukuran perubahan.
Berikut adalah bagaimana Anda dapat menghasilkan plot ini menggunakan
ggplot
diR
:Ini mengarah ke plot berikut:
Catatan: Saya sadar bahwa OP bermaksud menyoroti perubahan tingkat kematian sejak 1932, ketika tren di Jerman mulai naik. Bagi saya ini agak mirip dengan memetik ceri, dan saya merasa ragu ketika interval waktu dipilih untuk mendapatkan tren tertentu. Untuk alasan ini saya telah melihat interval pada seluruh rentang data, yang merupakan perbandingan yang berbeda dengan OP.
sumber
Meskipun tujuan yang dinyatakan adalah untuk menampilkan perubahan, tampaknya Anda juga ingin menampilkan rangkaian waktu tahunan menurut negara. Itu menunjukkan tidak sepenuhnya mengulang grafis, tetapi hanya memodifikasinya.
Karena perubahan menyangkut apa yang terjadi dari satu tahun ke tahun berikutnya, Anda dapat mempertimbangkan untuk mewakili perubahan dengan simbol grafis yang menjangkau tahun-tahun berikutnya: yaitu segmen garis yang menghubungkan titik data dalam plot.
Karena warna sangat berguna untuk membedakan negara, dan sebaliknya tidak begitu baik dalam menunjukkan variabel kuantitatif, yang membuat kita pada dasarnya hanya dua karakteristik lain yang dapat divariasikan untuk menunjukkan perubahan: gaya dan ketebalan segmen. Karena tesis Anda menyangkut perubahan positif, Anda ingin membuat segmen garis untuk peningkatan lebih menonjol: gaya mereka harus lebih berkelanjutan dan mereka harus lebih tebal.
Akhirnya, tesis Anda menyangkut data setelah 1932. Kami ingin menekankan elemen-elemen grafik relatif terhadap yang lain. Itu bisa dilakukan dengan menjenuhkan warna.
Solusi ini segera memberikan wawasan yang tidak terlihat dalam aslinya:
Tidak ada negara yang mengalami peningkatan angka kematian tahunan untuk semua tahun setelah tahun 1932. Negara mana pun akan muncul sebagai garis solid yang berkelanjutan, tetapi tidak ada garis tersebut.
Banyak perubahan yang seharusnya dikaitkan dengan faktor-faktor yang umum di semua negara. Ini terlihat pada kesamaan gaya garis dan ketebalan dalam kolom vertikal. Misalnya, selama periode 1934-35 angka kematian meningkat di hampir semua negara, di mana pada 1933-34 mereka menurun di hampir semua negara.
Jerman tidak biasa dalam mengalami peningkatan besar angka kematian pada 1932-33 dan juga sedikit meningkat pada 1935-36.
Ini menunjukkan melakukan eksplorasi dua arah yang kuat dari perubahan dalam tingkat kematian versus negara, mungkin dengan median polish, untuk menembus lebih dalam ke kinerja relatif negara-negara Eropa selama periode ini.
Jika Anda hanya ingin menekankan perbedaan antara 1937 dan 1932, teknik serupa dapat digunakan untuk melambangkan bagian dari jalan di antara tanggal-tanggal tersebut. Jerman akan menonjol:
sumber
Slopegraphs
Salah satu cara Anda dapat menyajikan data Anda menggunakan slopegraph yang sangat baik untuk membandingkan perubahan atau gradien (beberapa tautan: 1 2 )
Dibawah ini
Di sebelah kiri contoh slopegraph yang menunjukkan bagaimana ini terlihat untuk kasus Anda.
Di tengah slopegraph yang lebih kompleks juga menunjukkan tahun 1932
Di sebelah kanan variasi slopegraph, lebih banyak semacam grafik mini, di mana semua data ditampilkan (artinya tidak ada garis lurus).
Saya tidak yakin yang mana yang terbaik. Opsi ketiga / kanan memberikan ide yang lebih kuat tentang variasi dari tahun ke tahun (dan misalnya menjadi lebih terlihat bahwa Danmark vs Jerman tidak terlihat begitu berbeda dan naik turun banyak dari tahun ke tahun) tetapi dapat juga mengganggu (terutama puncak 1929). Jadi yang mana yang lebih baik tergantung pada apa yang ingin Anda sampaikan dengan grafik dan berapa banyak detail yang dibutuhkan cerita Anda (mis. Sekitar tahun 1932 dengan pemerintah yang berbeda yang lebih jelas dalam opsi kedua / menengah).
Variasi dari slopegraph di sebelah kanan terlihat sangat mirip dengan grafik oleh Xan. Namun, selain perbedaan gaya ada satu lagi perbedaan penting. Lebar dan tinggi gambar dipilih sedemikian rupa sehingga sudut kurva mendekati 45 derajat. Dengan cara ini perbedaannya lebih menonjol (saya percaya bahwa contoh terbaik adalah contoh sunspot oleh Edward Tufte )
Lebih banyak konteks
Jika Anda ingin menambahkan lebih banyak kompleksitas daripada slopegraph sederhana, maka saya percaya sebenarnya lebih baik untuk menampilkan lebih banyak data di luar kisaran 1927-1937 daripada di dalam kisaran. (lagi-lagi sebuah contoh oleh Tufte dari halaman 74-75 dalam The Visual Display of Quantitive Information yang dapat Anda peroleh melalui halaman ini di papan buletin di situs webnya)
Contoh di bawah ini menunjukkan data untuk tahun 1900-2000 (tidak termasuk Polandia yang datanya agak sulit) diekstraksi dari wikipedia (misalnya halaman ini untuk Republik Ceko ) dan untuk Swiss dan Belanda biro statistik nasional mereka ( bfs dan Statline ).
(Data sedikit berbeda dari milik Anda tetapi sama seperti misalnya artikel "Autarki, disintegrasi pasar, dan kesehatan: Krisis kematian dan gizi di Jerman Nazi, 1933-1937" oleh Jörg Baten dan Andrea Wagner. Artikel ini menarik untuk membaca karena mereka menyediakan lebih banyak data daripada hanya angka kematian kasar, meskipun mereka juga membatasi diri mereka untuk periode kecil.Terutama yang menarik adalah bahwa kenaikan tingkat kematian, dari 1932 ke 1937, terutama ada di antara kota-kota di strip dari Frankfurt ke Bremen dan Hamburg)
Saya percaya bahwa grafik ini penting karena menunjukkan bahwa Jerman membuat penurunan yang sangat kuat sebelum kenaikan setelah 1932. Lebih kuat dari negara lain. Sehingga Anda dapat memiliki interpretasi negatif dan positif. Angka kematian Jerman meningkat lebih dari negara-negara lain antara 1932-1937, tetapi apakah ini (1) naik dari puncak yang rendah, atau (2) naik menuju puncak yang tinggi? Aspek yang menarik dalam hal ini adalah bahwa tingkat 10.8 1932 adalah tingkat yang sangat rendah untuk Jerman (pada titik ini hanya Belanda yang memiliki tingkat kematian yang lebih rendah). Ini bukan hanya level terendah untuk tahun-tahun hingga 1937, tetapi juga dibutuhkan hingga 1995 sebelum level 10.8 ini tercapai lagi.
Poin lain, terkait dengan kesehatan (jika ini adalah konteks Anda) mungkin lebih baik untuk membandingkan harapan hidup, komposisi demografis populasi memiliki pengaruh pada tingkat kematian, terlepas dari perubahan dalam situasi kesehatan
Konteks tambahan yang sedikit kurang
Grafik di atas menunjukkan totalitas tetapi mungkin berlebihan untuk sebagian besar tujuan (kecuali dalam posting ini di mana saya ingin menunjukkan seluruh sejarah dan lebih untuk tujuan eksplorasi). Grafik di bawah ini merupakan alternatif yang, saya percaya, masih layak.
sumber
Bergantung pada audiens, tetapi saya akan menyederhanakan hal-hal:
Lalu, ungkapkan dalam teks mis
(BTW apa ch vs cz yaitu negara mana yang saya lewatkan di atas?)
Untuk menjadi menyeluruh, Anda tentu saja perlu mempertimbangkan
death rate
perkiraan populasi saat 'mengumpulkan' ini untuk 'Lainnya', tetapi saya yakin informasi ini sudah tersedia untuk Anda.Pembaruan 6/9/18: Ini tentu saja merupakan sketsa 'mainan' dan tidak berasal dari data; idenya adalah untuk memberikan draf kasar dari bentuk grafik yang harus diambil.
atau lebih baik, jika Anda memiliki info populasi. untuk setiap tahun:
Bergantung pada jumlah pembaca (mis. Ahli epidemiologi vs sejarawan) standar deviasi atau kesalahan standar dapat ditambahkan ke yang terakhir, meskipun saya pikir ini lebih akan merusak tampilan sederhana plot.
sumber
ch
adalah Swiss. (Dan BTW, itu belum Republik Ceko di 30-an.) - Yang saya tidak suka tentang pendekatan Anda adalah bahwa tidak jelas bahwa tren penurunan konsisten melalui negara-negara lain. Mungkin tampak seolah-olah hanya ada fluktuasi acak yang terjadi rata-rata ke sesuatu yang negatif di negara lain, tetapi hasilnya positif di Jerman.Jika Anda ingin menyoroti perubahan, maka mungkin hitung ini dan tampilkan itu. Menggunakan peta panas untuk menampilkan perubahan dapat bermanfaat karena memungkinkan perbandingan dibuat tanpa terlalu banyak masalah dan menghindari masalah interpolasi yang dapat berasal dari grafik garis.
Menggunakan data Anda seperti
d
dalam R:Perhatikan bahwa data sekarang berubah dari tahun sebelumnya. Anda dapat melihat bahwa Jerman memiliki sekelompok blues (peningkatan angka kematian) setelah 1932 yang tidak dimiliki negara lain. Anda juga dapat melihat bahwa antara tahun 1934 dan 1935 semua negara kecuali Polandia menyaksikan peningkatan angka kematian, tetapi tren bucking Jerman tampaknya adalah 1932-1933 dan 1935-1936 (serta 1927-1928).
Salah satu fitur yang menarik adalah kenyataan bahwa warna lebih intens di sebelah kiri dibandingkan ke kanan. Ini berarti bahwa besarnya perubahan lebih tinggi pada awal periode, dan lebih bisu menjelang akhir.
Saya akan merekomendasikan memasangkan ini dengan grafik garis yang menunjukkan level juga.
sumber
Di sini saya menunjukkan kepada Anda perbedaan logaritma rasio kematian per 1000 penduduk, sehubungan dengan tahun sebelumnya (oleh karena itu 1927 tidak diperlihatkan). Jerman ditampilkan dalam warna merah sementara rata-rata negara lain ditampilkan dalam garis hitam tebal.
Jerman mengalami peningkatan rasio dalam 5 dari 10 tahun. Setelah 1932 ia mengatakan di atas rata-rata negara lain (dan sebagian besar positif), hingga 1937.
Padahal mengapa logaritma? Alasannya sederhana: perubahan dari 2 ke 1 lebih drastis daripada perubahan dari 1000 menjadi 999 :)
Kode:
sumber
Satu versi lagi: rasio (angka kematian rata-rata dari tahun 1927 hingga tahun ini) / (angka kematian 1927)
Dilakukan dengan kode Mathematica
(Puncak pada tahun 1929 tampaknya terkait dengan pandemi flu yang terjadi sekitar waktu itu)
sumber