Sumber daya untuk belajar menggunakan (/ membuat) visualisasi statistik dinamis (/ interaktif)

14

Saya ingin belajar lebih banyak tentang visualisasi data interaktif (zooming, menunjuk, menyikat, pemetaan titik dan sebagainya). Saya akan menyambut apa pun:

  1. Tutorial / panduan / buku (?) / Video tentang cara menggunakan metode tersebut untuk eksplorasi statistik.
  2. Pointer untuk paket data-viz interaktif yang baik / menarik (dalam R, dan di luarnya)

Hanya untuk memulai bola bergulir, saya tahu bahwa di R ada berbagai cara untuk mendapatkan visualisasi interaktif, seperti rggobi , paket googleViz R baru , paket animasi dan beberapa lainnya. Tetapi jika ada paket lain yang perlu ditelusuri (menawarkan hal-hal yang tidak dimiliki R), saya akan senang mengetahui tentang mereka (seperti jmp, mathlab, spss, sas, excel, dan sebagainya).

ps: ini adalah pertanyaan pertama yang menggunakan tag "interaktif-visualisasi"

Tal Galili
sumber
Saya kira @Shane akan mengatakan sesuatu di sini ketika berbicara tentang webvis (pengurai untuk protovis) karena protovis (didedikasikan untuk visualisasi web) ( vis.stanford.edu/protovis ) berisi kemungkinan grafik interaktif ...
robin girard
Di R, ada juga iPlots dan Rgl , tetapi solusi berbasis Javascript atau Python mungkin lebih fleksibel.
Vincent Zoonekynd

Jawaban:

13

Terlepas dari Protovis (HTML + JS) atau Mayavi (Python), saya akan merekomendasikan Pemrosesan yang mana

bahasa pemrograman sumber terbuka dan lingkungan untuk orang yang ingin membuat gambar, animasi, dan interaksi. Awalnya dikembangkan untuk berfungsi sebagai buku sketsa perangkat lunak dan untuk mengajarkan dasar-dasar pemrograman komputer dalam konteks visual.

Ada banyak skrip open-source di http://www.openprocessing.org/ , dan banyak buku terkait yang berhubungan dengan Pemrosesan tetapi juga visualisasi data.

Saya tahu ada proyek untuk menyediakan antarmuka R, memproses ulang , tapi saya tidak tahu bagaimana kelanjutannya. Ada juga antarmuka dengan clojure / incanter (lihat misalnya, Membuat Visualisasi Pemrosesan dengan Clojure dan Incanter ).

Ada banyak sumber daya online, di antaranya catatan kelas Stanford, mis. CS448B , atau 7 Classic Foundational Vis Papers .

chl
sumber
6

Beberapa paket lagi untuk ditambahkan ke saran Chl tentang Pemrosesan untuk membuat visualisasi interaktif. Semua ini berbasis javascript dan dapat berjalan di browser, sehingga dapat digunakan untuk penerbitan serta untuk analisis Anda sendiri:

  • D3.js adalah penerus Protovis. Ini lebih kuat karena Anda memiliki kontrol lebih besar atas objek yang dibuat (mereka adalah objek DOM yang tepat, yaitu Anda memiliki kontrol penuh atas mereka menggunakan javascript), tetapi beberapa lebih suka Protovis untuk kesederhanaan. Baik diskusi teknis D3 vs Protovis di sini .
  • Raphael.js adalah pilihan yang baik untuk interaktivitas web pasar massal yang sangat tersesuaikan karena keduanya merupakan bukti di masa depan (tanpa flash) dan berfungsi pada peramban setua IE6 (satu-satunya yang tidak berfungsi pada yang saya tahu adalah versi lama dari browser Android). Seperti D3, semuanya adalah objek DOM yang dapat ditargetkan dan memiliki kontrol api yang baik untuk animasi dan interaktivitas. Ini tidak menawarkan apa-apa di luar kotak yang khusus untuk visualisasi: itu adalah batu tulis kosong yang sangat kuat dan fleksibel, pilihan yang bagus untuk merancang visualisasi khusus tetapi tidak untuk analisis eksplorasi awal Anda sendiri. Kenali data Anda terlebih dahulu.
  • gRaphael.js adalah bagan standar (bar, baris, dll) untuk Raphael. Ini dasar tetapi berfungsi dan dapat dibangun di atas - mungkin merupakan bahan yang berguna jika Anda membangun suite Anda sendiri.

Mengenai pertanyaan Anda yang lain tentang belajar, untuk prinsip-prinsip umum, Desain Dashboard Informasi layak disebutkan, jika apa yang Anda inginkan adalah membuat array alat standar interaktif tujuan umum untuk data Anda.

Visualisasi interaktif berada di garis antara statistik dan desain interaktivitas : jadi buku yang dapat digunakan. Saya tidak memiliki pengalaman pribadi dari banyak buku teks desain interaksi, tapi saya penggemar berat Prinsip Universal Desain . Mungkin berlebihan untuk kebutuhan Anda, tetapi pertimbangkan untuk melihat ke bawah kolom Kegunaan dalam halaman Konten Kategorikal yang sangat baik dan membaca bab-bab yang tercantum (pengungkapan progresif, sinyal ke noise, dll).

Juga, bagi siapa pun yang baru dalam pemrograman, Pemrograman Interaktivitas adalah tempat yang baik untuk memulai meningkatkan keterampilan teknis (juga termasuk bab besar tentang Pemrosesan).

Tetapi untuk mengetahui apa yang berhasil dan apa yang mungkin, Anda tidak dapat mengalahkan belajar sambil melakukan , dan awal yang baik bisa mempertimbangkan untuk mengikuti dan menganalisa paket visualisasi interaktif tujuan besar big-price-tag-nama besar seperti tableau dan jmp , dan pikirkan mengapa fitur-fitur mereka dirancang sebagaimana adanya.

user56reinstatemonica8
sumber
Terima kasih telah menyunting tautan whuber - kalahkan saya!
user56reinstatemonica8
4

Selain Pemrosesan, periksa Nodebox berbasis-Python (1, 2, OpenGL), yang terinspirasi oleh Pemrosesan:

Nodebox 1 adalah Mac saja, sedangkan Nodebox 2 dan versi OpenGL adalah cross-platform.

Python memiliki banyak pustaka data rangkuman yang dapat diimpor ke Nodebox, misalnya, scipy.org

Ed Hagen
sumber
1

Sebagai pendekatan terpisah untuk jawaban yang ada, tak lama setelah saya memposting daftar panjang pertama saya, WEAVE muncul: sebuah suite visualisasi data khusus sumber terbuka. Berikut ini adalah artikel singkat tentang WEAVE di data terkemuka vis blog Flowing Data

Adalah bijaksana untuk mengambil pendekatan berbeda untuk visualisasi data tergantung di mana Anda berada dalam proses. Semakin awal Anda - semakin mentah dan belum dijelajahi data Anda - semakin besar kemungkinan Anda mendapatkan manfaat dari suite yang dibuat sebelumnya, fleksibel, dan bersifat umum seperti WEAVE dan itu adalah sumber tertutup mitra komersial seperti Tableau dan JMP - Anda dapat mencoba berbagai hal dengan cepat dan tanpa kenal lelah untuk mengetahui data dan untuk mencari tahu jalur serangan apa yang harus diambil untuk mendapatkan hasil maksimal dari itu.

Saat Anda menemukan lebih banyak tentang data, fokus Anda cenderung bergeser ke arah komunikasi atau 'eksplorasi terpandu' - visualisasi data eksplorasi yang lebih khusus yang dirancang berdasarkan peringatan, nuansa, dan bidang minat yang kini Anda temukan dalam data. Di sinilah produk batu tulis kosong seperti alat menggambar vektor terprogram yang tercantum di atas menjadi milik mereka.

user56reinstatemonica8
sumber