Melalui situs ini, saya baru saja menemukan Diagram Sankey, cara yang bagus untuk memvisualisasikan apa yang terjadi dalam diagram alur tradisional .
Berikut adalah contoh yang baik dari Diagram Sankey oleh George M. Whitesides dan George W. Crabtree , Source; Jangan Lupa Riset Fundamental Jangka Panjang dalam Energi , Sains 9 Februari 2007: Vol. 315. no. 5813, hlm. 796 - 798.
Setelah saya menyadari bahwa tidak ada paket R Sankey saya menemukan skrip R online , sayangnya skrip ini cukup mentah dan agak terbatas. Dengan harapan besar saya meminta paket-R Sankey atau fungsi yang lebih matang di stackoverflow , tetapi yang mengejutkan saya sepertinya kita tidak memiliki fungsi dewasa untuk membuat diagram Sankey di R.
Setelah saya memposting hadiah Geek On Acid cukup baik untuk menyarankan hack kecil pada skrip yang ada yang membuatnya bekerja lebih atau kurang untuk tujuan spesifik saya.
R-script yang ditingkatkan menghasilkan diagram ini, Sumber; stackoverflow.com .
Tetapi, apakah tidak adanya paket R mengindikasikan bahwa Diagram Sankey bukanlah cara yang menakjubkan untuk memvisualisasikan gesekan menggunakan R dalam aliran data à la yang disajikan dalam diagram di atas (lihat pertanyaan stackoverflow awal untuk data dan kode R. Mungkin ada cara yang lebih baik untuk memvisualisasikan gesekan.
Menurut Anda apa cara terbaik untuk memvisualisasikan gesekan dalam aliran data menggunakan R?
sumber
Jawaban:
Saya setuju dengan @ung. Diagram Sankey yang Anda posting adalah, saya pikir, contoh yang cukup bagus dari mana teknik ini dapat membantu. Meskipun rumit, konteksnya (input dan output energi) juga rumit dan sulit untuk memikirkan cara yang lebih baik untuk memvisualisasikan jalur input-ke-output-bertindak-sebagai-input-baru di berbagai kategori penggunaan.
Nah, untuk contoh gesekan yang Anda posting, seperti yang orang lain catat, tidak berguna untuk menggunakan diagram Sankey. Saya pikir Anda perlu memposting set lengkap variabel Anda jika Anda ingin rekomendasi yang baik tentang visualisasi alternatif. Jika Anda hanya ingin menunjukkan perbedaan dalam sumber gesekan antara situs dan dokter, serangkaian kecil titik dot dapat menjadi yang termudah untuk dipahami oleh audiens Anda dan untuk Anda terapkan ( lihat contoh ini , di mana dalam kasus Anda, kelompok dapat situs, elemen dalam kelompok akan menjadi penyebab gesekan, dan sumbu horizontal akan 0-100%).
Jika diagram Sankey adalah sesuatu yang ingin Anda gunakan, dan Anda bersedia mencoba-coba dalam bahasa tingkat tinggi lain, ada contoh yang bagus (dengan kode) pada galeri untuk paket plot Python, matplotlib.
sumber
Saya tidak akan selalu menganggap kurangnya metode menyiratkan bahwa metode itu tidak penting atau tidak berguna. Lagi pula, untuk semua metode yang saat ini ada di R, ada waktu (sangat mungkin baru - R hanya ~ 10 tahun) ketika tidak ada paket untuk itu.
Namun, saya harus berpikir ada sejumlah cara untuk memvisualisasikan data seperti gesekan. Pikiran pertama saya melihat bagan Anda, adalah bahwa itu dapat diwakili dengan plot titik . Kemungkinan lain juga ada. Fungsionalitas ekstra dari Diagram Sankey akan ikut bermain ketika Anda memiliki beberapa gesekan karena penyebab tertentu pada satu titik, dan kemudian lebih karena penyebab yang sama nanti dengan input dan output lain di antaranya. Itu akan lebih rumit untuk diwakili oleh plot standar (itu juga lebih sulit untuk diikuti bahkan dengan diagram Sankey - misalnya, yang di bagian atas halaman membutuhkan kerja yang cukup banyak untuk dibaca). Karena Anda tampaknya tidak memilikinya, diagram Sankey tampaknya cukup, tetapi berlebihan.
sumber
Bagaimana dengan menggunakan kode R untuk menulis file SVG dengan lebar panah diatur sesuai dengan data Anda, dan tata letak yang sederhana. Kemudian muat ke Inkscape dan tekuk panah di sekitar, tambahkan label dll untuk konten hati Anda untuk membuat sesuatu yang cantik.
Masalah yang jelas: Anda harus mengulang semua prettifikasi Anda di Inkscape jika data Anda berubah (meskipun Anda mungkin dapat menggunakan SVG cantik Anda dari Inkscape sebagai templat dan hanya mengganti lebar panah baru di).
Tapi jujur, jika kekacauan multi-warna dari pertengkaran di atas adalah diagram Sankey yang baik, saya benci melihat yang buruk dengan perut penuh [walaupun menatapnya selama beberapa menit lagi telah memberi saya petunjuk tentang tentang apa itu, grafik yang bagus tidak perlu itu].
sumber