Saya ingin membuat grafik dan mengeksplorasi data langsung / yang diukur secara interaktif. Ada beberapa opsi di luar sana, dengan plot.ly menjadi yang paling ramah pengguna. Plot.ly memiliki UI yang fantastis dan mudah digunakan (mudah scalable, pannable, mudah diperbesar / pas untuk layar), tetapi tidak dapat menangani set besar data yang saya kumpulkan. Adakah yang tahu ada alternatif lain?
Saya memiliki MATLAB, tetapi tidak memiliki cukup lisensi untuk menjalankan ini sekaligus melakukan pengembangan secara bersamaan. Saya tahu bahwa LabVIEW akan menjadi pilihan yang bagus, tetapi saat ini biayanya mahal.
Terima kasih sebelumnya!
dataset
visualization
Clayton Pipkin
sumber
sumber
Jawaban:
Untuk jawaban ini, saya telah mengasumsikan bahwa Anda lebih suka solusi open source untuk visualisasi data besar . Asumsi ini didasarkan pada perincian anggaran dari pertanyaan Anda. Namun, ada satu pengecualian untuk ini - di bawah ini saya akan menambahkan referensi ke satu produk komersial, yang saya yakin mungkin bermanfaat dalam kasus Anda (asalkan Anda mampu membelinya). Saya juga berasumsi bahwa solusi berbasis browser dapat diterima (saya bahkan lebih suka mereka, kecuali jika Anda memiliki persyaratan kontradiktif tertentu).
Secara alami, kandidat pertama sebagai solusi untuk masalah Anda, saya akan mempertimbangkan perpustakaan JavaScript D3.js : http://d3js.org . Namun, terlepas dari fleksibilitas dan manfaat lainnya , saya pikir solusi ini terlalu rendah .
Oleh karena itu, saya akan merekomendasikan Anda untuk melihat proyek open source berikut untuk visualisasi data besar , yang cukup kuat dan fleksibel , tetapi beroperasi pada tingkat abstraksi yang lebih tinggi (beberapa di antaranya didasarkan pada fondasi D3.js dan kadang-kadang disebut sebagai tumpukan visualisasi D3.js ).
Secara terpisah, saya ingin menyebutkan dua analisis data besar open source dan proyek visualisasi , berfokus pada grafik / data jaringan (dengan beberapa dukungan untuk streaming data dari jenis itu): Cytoscape dan Gephi . Jika Anda tertarik pada beberapa lainnya, lebih spesifik ( dukungan peta , dll.) Atau komersial (tingkatan bebas dasar), proyek dan produk, silakan lihat kompilasi yang luar biasa ini , yang saya kurasi dengan cermat untuk membuat daftar utama di atas dan menganalisis : http://blog.profitbricks.com/39-data-visualization-tools-for-big-data .
Akhirnya, seperti yang saya janjikan di awal, Zoomdata - produk komersial, yang saya pikir Anda mungkin ingin melihat: http://www.zoomdata.com . Alasan saya membuat pengecualian untuk itu dari kompilasi perangkat lunak open source saya adalah karena dukungan built-in untuk platform big data . Secara khusus, Zoomdata menyediakan konektor data untuk Cloudera Impala, Amazon Redshift, MongoDB, Spark dan Hadoop, plus mesin pencari, mesin basis data utama, dan data streaming.
Disclaimer: Saya tidak memiliki afiliasi dengan Zoomdata apapun - Aku hanya terkesan dengan mereka berbagai pilihan konektivitas (yang mungkin biaya Anda mahal, tapi itu lain aspek analisis topik ini).
sumber
Memvisualisasikan kumpulan data besar adalah masalah yang sudah berlangsung lama. Salah satu masalah adalah untuk memahami bagaimana kami dapat menampilkan lebih dari satu juta poin di layar yang hanya memiliki ~ juta piksel.
Karena itu, berikut adalah beberapa alat yang dapat menangani data besar:
sumber
Jika Anda menggunakan python, saya sarankan menggunakan mpld3 yang menggabungkan visualisasi javascript D3js dengan matplotlib python.
Instalasi dan penggunaannya sangat sederhana dan memiliki beberapa plugin keren dan barang interaktif.
http://mpld3.github.io/
sumber