Saya telah membaca buku Tukey "Analisis Data Eksplorasi". Ditulis pada tahun 1977, buku ini menekankan metode kertas / pensil. Apakah ada penerus yang lebih 'modern' yang memperhitungkan bahwa kita sekarang dapat langsung memplot set data besar?
data-visualization
references
descriptive-statistics
eda
biofreezer
sumber
sumber
Jawaban:
Yang paling dekat adalah Data Visualisasi Cleveland . Ini tentang Analisis Data Eksplorasi, ini tentang visualisasi yang dihasilkan komputer, ini mendalam, ini klasik.
sumber
Yah, ini bukan replika yang tepat, tapi saya menemukan banyak saran merencanakan yang berguna (dan kode R) dalam Analisis Data Gelman dan Hill menggunakan Regresi dan Model Multilevel / Hierarchical
Selain itu, blognya sering penuh dengan saran grafis yang bermanfaat.
sumber
Grafik Interaktif untuk Analisis Data: Prinsip dan Contoh adalah yang saya sukai; deskripsi buku mengatakan itu "membahas analisis data eksplorasi (EDA) dan bagaimana metode grafis interaktif dapat membantu mendapatkan wawasan serta menghasilkan pertanyaan dan hipotesis baru dari dataset."
sumber
Buku ggplot2 Hadley Wickham menarik karena mengajarkan baik Grammar of Graphics dan cara menggunakan perangkat lunak ggplot2.
sumber
Data Eksplorasi Ronald Pearson di bidang Teknik, Ilmu, dan Kedokteran layak disebutkan di sini. Target pembaca utamanya adalah para ilmuwan yang tidak takut pada matematika kecil yang berharap mereka tahu lebih banyak statistik. Itu adalah kelompok yang cukup besar, dan satu diwakili dengan baik di sini. Agak aneh dan tidak biasa, tetapi mencakup banyak hal dan termasuk banyak saran yang masuk akal. Bukan Tukey yang ditinjau kembali dalam arti menawarkan banyak ide baru, tetapi bisa bermanfaat untuk belajar, bahkan ketika Anda berpikir itu sedikit salah kaprah.
Buku ini tampaknya telah menarik perhatian sangat sedikit, sangat mungkin karena sangat mahal, tidak jelas cocok sebagai teks saja, dan sampai sekarang hanya tersedia dalam bentuk bersampul tebal. Tapi itu cerdas dan mudah dibaca dan bebas dari sampah buku pelajaran pengantar modern (halaman dan halaman latihan dasar, ikon konyol, foto serampangan orang muda yang bahagia, tata letak rewel dengan kotak, apa pun, dll).
sumber
Juga Grafis Interaktif dan Dinamis untuk Analisis Data: Dengan Contoh Menggunakan R dan GGobi, Cook dan Swayne
Ini memiliki dua bab yang tersedia untuk umum di web yang menggambarkan proses analisis data, dan menangani nilai yang hilang. Ada buku baru yang akan segera diterbitkan oleh Antony Unwin.
sumber
Sepasang buku bagus lainnya untuk dibaca adalah Visualisasi Cantik dan Data Cantik. Ini adalah buku yang diedit, ada contoh luar biasa yang baik untuk mengeksplorasi data dengan plot, dan beberapa bab yang benar-benar mengerikan.
Buku lain yang memiliki beberapa contoh bagus menggunakan ggplot2 adalah yang baru oleh Winston Chang
sumber
Saya memikirkan Memahami analisis yang kuat dan eksplorasi oleh Hoaglin, Mosteller dan Tukey dan volume pendamping pada Menjelajahi tabel dan bentuk data sebagai tindak lanjut teknis untuk EDA. Saya juga melihat analisis data dan regresi, kursus kedua dalam statistik oleh Mosteller dan Tukey sebagai tindak lanjut EDA. Berbagai buku Cleveland yang disebutkan di atas adalah harta karun.
sumber