Saya mencoba memvisualisasikan beberapa data konsumen, yang memiliki 4 kategori. Pengguna bebas untuk beralih di antara berbagai kategori. Saya ingin memvisualisasikan tiga atau empat sakelar terakhir untuk setiap individu.
Jadi kita akan mulai dengan plot dengan kolom dengan 4 proporsi ditumpuk. Setelah itu kita akan memiliki 16 karena setiap kategori dipecah menjadi apa yang dilakukan orang pada kesempatan sebelumnya, lalu 64, dan seterusnya, sampai sampah menjadi terlalu kecil untuk berguna.
Saya berpikir di suatu tempat antara grafik marimekko dan barchart yang ditumpuk atau gram dendro seharusnya bekerja, tetapi saya bahkan tidak tahu apa yang akan disebut!
Jika ada yang bisa membantu dengan jenis plot yang harus saya gunakan, dan, jika Anda ingin menjadi lebih baik, bagaimana menerapkannya dalam R maka saya akan sangat berterima kasih.
sumber
Jawaban:
Satu ide potensial adalah penggunaan diagram Sankey untuk mendokumentasikan aliran pilihan antar kategori. Dua contoh untuk menggambarkan apa yang saya bicarakan adalah;
Dengan pembaruan atas beberapa masalah Anda yang diungkapkan dalam komentar. Tampaknya bagi saya bahwa program Set Paralel melakukan apa yang Anda inginkan di luar kotak. Di bawah ini adalah output dari program, di mana saya membuat 4 variabel acak dengan 4 kategori. Grup apa pun yang Anda inisialisasi ke bagian atas tampilan akan dibagi secara berurutan di antara kategori berikutnya. Menciptakan pemisahan yang Anda inginkan.
Juga tidak terlihat dalam gambar ini paket memiliki beberapa fungsi interaktif yang memungkinkan untuk analisis data eksplorasi yang lebih mudah, seperti ketika Anda mengarahkan kursor ke salah satu kategori yang semua keturunannya disorot.
dec1
dec4
exp
dec
dec3_exp12
121
dec1 = 1 and dec2 = 2 and dec3 = 1
Setelah bermain-main dengan Fineo abit lebih banyak, ini adalah aplikasi yang rapi, tetapi sangat terbatas. Set Paralel memiliki lebih banyak fungsi, jadi saya sarankan Anda memeriksa sebelum aplikasi Fineo.
Saya pikir program ParSets adalah pilihan yang jauh lebih baik daripada pemisahan kategori menjadi subset untuk pengujian. Sebagai contoh, dengan menggunakan data acak yang sama seperti di atas, berikut adalah plot titik yang merencanakan kategori proporsi dalam
decision 2
kondisi yang dipilih pada kategori yang dipilihdecision 1
.Anda dapat melakukan rincian yang sama untuk perubahan dari
decision 2
menjadidecision 3
, tetapi buat beberapa bagan kecil untuk apa yang awalnyadecision 1
.Anda dapat melanjutkan ini tanpa batas (lihat di bawah). Ini mungkin mencerahkan, tapi saya kira itu akan cukup menakutkan pada saat Anda mendapatkan lebih banyak panel. Di bawah ini seperti yang diminta, memvisualisasikan 4 pilihan kategori berturut-turut.
Seperti disebutkan sebelumnya, angka kecil pada saat Anda membagi grafik Anda ke dalam begitu banyak kategori bermasalah. Salah satu cara untuk menghitungnya adalah dengan memetakan estetika seperti ukuran ke garis dasar di mana proporsi didasarkan. Ini menyusutkan pengamatan berdasarkan jumlah yang lebih kecil dari pandangan. Anda juga dapat menggunakan transparansi (tapi saya sudah membuat poin transparan untuk membedakan poin overplotted dalam contoh ini).
Saya membayangkan beberapa membayangkan pohon Natal seperti struktur simpul sebagai lawan dari plot titik, tapi saya tidak tahu bagaimana membuat grafik seperti itu. Saya curiga itu akan menjadi masalah besar yang sama. Kelipatan kecil ini tidak buruk, tetapi IMO Set Paralel jauh lebih intuitif dan saya menduga beberapa pola yang tidak jelas akan lebih jelas dalam visualisasi itu. Mungkin seseorang yang lebih imajinatif daripada saya dapat menghasilkan beberapa data yang lebih menarik daripada hanya 4 kategori acak.
sumber