Saya melihat pos ini di Moz yang menyajikan saluran pemasaran tersegmentasi:
Hal semacam ini akan memiliki nilai yang cukup besar dalam pekerjaan saya. Apa yang saya tidak tahu adalah bagaimana memvisualisasikan data mentah untuk menampilkan saluran tersegmentasi seperti ini. Idenya adalah bahwa arahan penjualan berasal dari sumber yang berbeda (yang kami gunakan untuk mengelompokkan data berdasarkan) dan melewati beberapa tahap pada saat mereka mengkonversi ke kesepakatan. Dari setiap tahap ke tahap lainnya beberapa drop off. Lebar masing-masing irisan ditentukan oleh jumlah absolut timah di masing-masing. [ EDIT : Perhatikan bahwa gambar yang digunakan di sini untuk referensi menyesatkan ketika sampai pada angka yang ditentukan di sebelah kanan setiap irisan. Tampaknya tidak ada hubungan antara lebar irisan dan angka. Gambar hanya dapat diambil sebagai referensi untuk desain corong tersegmentasi].
Lagi pula, ada ide bagaimana memvisualisasikannya? Jika memungkinkan, saya ingin memiliki cara untuk melakukannya dengan Python.
Berikut adalah Google Doc dengan beberapa data dummy jika ada yang membutuhkan ...
Menantikan wawasan Anda. Terima kasih!
sumber
Jawaban:
Plot ini menampilkan tabel kontingensi dua arah yang datanya sekitar ini:
Ada banyak cara untuk membangun plot ini. Misalnya, Anda dapat menghitung posisi setiap patch warna persegi panjang dan secara terpisah menempelkan setiap patch. Namun, secara umum, ini membantu untuk menemukan deskripsi singkat tentang bagaimana suatu plot merepresentasikan data.
Sebagai titik tolak, kita dapat melihat yang ini sebagai variasi dari bagan batang yang ditumpuk.
Plot ini hampir tidak membutuhkan deskripsi: melalui keakraban kita tahu bahwa setiap baris persegi panjang sesuai dengan setiap baris tabel kontingensi; bahwa panjang persegi panjang berbanding lurus dengan jumlah mereka; bahwa mereka tidak tumpang tindih; dan bahwa warnanya sesuai dengan kolom tabel.
Jika kita mengonversi tabel ini menjadi "kerangka data" atau "tabel data" memiliki satu baris per hitungan dengan bidang yang menunjukkan nama baris, nama kolom, dan jumlah, maka memplotnya biasanya sama dengan memanggil fungsi yang sesuai dan menentukan di mana menemukan nama baris, nama kolom, dan jumlah. Menggunakan implementasi Grammar of Graphics ( paket untuk ) ini akan terlihat sepertiX
ggplot2
R
Detail grafik, seperti seberapa lebar baris balok dan warna apa yang digunakan, biasanya perlu ditetapkan secara eksplisit. Cara melakukannya tergantung pada lingkungan yang merencanakan (dan begitu juga dengan minat yang relatif kecil: Anda hanya perlu mencarinya).
Implementasi khusus dari Grammar of Graphics ini memberikan sedikit fleksibilitas dalam memposisikan bar. Salah satu cara untuk menghasilkan tampilan yang diinginkan, dengan sedikit usaha, adalah memasukkan kategori yang tidak terlihat di dasar setiap batang sehingga batang berada di tengah. Sedikit pemikiran menunjukkan jumlah palsu yang dibutuhkan untuk memusatkan setiap batang harus menjadi rata-rata panjang total batang dan dari batang terpanjang. Untuk contoh ini, ini akan menjadi kolom awal dengan nilai
Berikut adalah bagan batang yang ditumpuk yang menunjukkan data palsu berwarna abu-abu terang:
Angka yang diinginkan dibuat dengan membuat grafik untuk kolom palsu tidak terlihat:
Grammar of Graphics description dari plot tidak perlu diubah: kami hanya menyediakan tabel kontingensi berbeda yang akan diberikan sesuai dengan deskripsi yang sama (dan mengesampingkan penetapan warna default untuk kolom palsu).
Komentar
Grafik ini jujur: tingkat horizontal setiap tambalan berwarna berbanding lurus dengan data yang mendasarinya, tanpa distorsi. Membandingkannya dengan yang asli (dalam pertanyaan) mengungkapkan betapa ekstremnya distorsi ( Faktor Lie Tufte ).
Jika diinginkan untuk menampilkan detail di bagian bawah "corong," pertimbangkan untuk mewakili penghitungan menurut wilayah daripada panjang. Anda bisa membuat panjang batang sebanding dengan akar kuadrat dari total panjang dan lebarnya (dalam arah vertikal) juga sebanding dengan akar kuadrat. Sekarang bagian bawah "corong" akan sekitar satu-dua puluh panjang terpanjang, daripada satu per empat ratus, memungkinkan beberapa detail untuk ditampilkan. Sayangnya,
ggplot2
implementasi tidak memungkinkan seseorang untuk memetakan variabel dengan lebar bar, dan karenanya diperlukan kerja-sekitar (yang memang menggambarkan masing-masing persegi panjang secara individual). Mungkin ada implementasi Python yang lebih fleksibel.Referensi
Edward Tufte, Tampilan Visual Informasi Kuantitatif . Cheshire Press 1984.
Leland Wilkinson, The Grammar of Graphics. Springer 2005.
sumber
Anda dapat mencoba menggunakan corong tersegmentasi dengan alur dalam python untuk membangunnya. Berikut tutorialnya: https://moderndata.plot.ly/segmented-funnel-charts-in-python-using-plotly/
Semoga ini membantu.
sumber