Apakah ada model visualisasi yang bagus untuk menunjukkan persimpangan tumpang tindih banyak set?
Saya sedang memikirkan sesuatu seperti diagram Venn, tetapi entah bagaimana itu dapat memberikan lebih banyak jumlah set yang lebih besar seperti 10 atau lebih. Wikipedia memang menunjukkan beberapa diagram Venn set yang lebih tinggi tetapi bahkan 4 diagram set banyak yang bisa diterima.
Dugaan saya mengenai hasil akhir data adalah banyak set tidak akan tumpang tindih sehingga ada kemungkinan diagram Venn baik-baik saja - tetapi saya ingin menemukan alat komputer yang dapat menghasilkan itu. Bagiku bagaikan bagan Google tidak memungkinkan banyak set.
data-visualization
dataset
Kyle Brandt
sumber
sumber
Jawaban:
Ketika Anda memiliki sejumlah besar set, saya akan mencoba sesuatu yang lebih linier dan menunjukkan tautannya secara langsung (seperti grafik jaringan). Flare dan Protovis keduanya memiliki utilitas untuk menangani visualisasi ini.
Lihat pertanyaan ini untuk beberapa contoh seperti ini:
sumber
Ini tidak akan bersaing dengan jawaban @ Shane karena tampilan melingkar sangat cocok untuk menampilkan hubungan yang kompleks dengan kumpulan data dimensi tinggi.
Untuk diagram Venn, saya telah menggunakan paket venneuler R. Ini memiliki antarmuka yang sederhana namun intuitif dan menghasilkan diagram yang bagus dengan transparansi, dibandingkan denganK= 4
venn()
fungsi dasar yang dijelaskan dalam Journal of Statistical Software . Itu tidak menangani lebih dari 3 kategori. Proyek lain adalah eVenn dan berkaitan dengan set.Baru-baru ini, saya menemukan paket baru yang berhubungan dengan set relasi tingkat tinggi, dan mungkin memungkinkan untuk mereproduksi beberapa diagram Venn yang diperlihatkan di Wikipedia atau di halaman web ini, Apa itu Diagram Venn? , tetapi juga terbatas pada set. Itu disebut VennDiagram, tetapi lihat makalah referensi: VennDiagram: paket untuk pembuatan diagram Venn dan Euler yang sangat dapat disesuaikan dalam R (Chen dan Boutros, BMin Bioinformatics 2011, 12:35).K= 4
Untuk referensi lebih lanjut, Anda mungkin tertarik
Diagram Venn memiliki keterbatasan. Dalam hal ini, saya menyukai pendekatan yang diambil oleh Robert Kosara dalam Sightings: A Vennerable Challenge , atau dengan Parallel Sets (tetapi lihat juga diskusi ini di weblog Andrew Gelman).
sumber
Kami mengembangkan pendekatan berbasis matriks untuk set persimpangan yang disebut UpSet, Anda dapat memeriksanya di http://vcg.github.io/upset/ . Berikut ini sebuah contoh:
Matriks di sebelah kiri menunjukkan persimpangan yang diwakili oleh baris, baris terakhir di sini, misalnya, adalah persimpangan dari genre film "Action, Adventure, and Children". Balok di sebelah kanan menunjukkan ukuran persimpangan, 4 dalam contoh ini.
Anda juga dapat memplot atribut dari persimpangan atau pilihan lain, dll. Periksa situs web untuk detailnya.
Sekarang ada juga versi statis untuk R yang dapat Anda temukan di situs web yang disebutkan di atas, atau dengan membuka di sini: https://github.com/hms-dbmi/UpSetR/
Laporan mutakhir tentang visualisasi set dapat diakses di http://www.cvast.tuwien.ac.at/SetViz - sebagian besar di antaranya bersifat akademis dan tidak disertai dengan kode yang tersedia.
sumber