Mempertahankan komentar pada grafik untuk analisis data eksplorasi

8

Dalam melakukan analisis data eksplorasi, saya akan sering mencetak grafik dan menulis komentar / penjelasan dll.

Apakah orang memiliki saran untuk metodologi elektronik yang lebih baik? Saya terutama tertarik pada python / R.

Saya mencari sesuatu 'cepat (dan kotor)' yang tidak memperlambat pekerjaan eksplorasi, tetapi membantu memasukkan wawasan yang telah saya buat.

Apa yang bisa saya bayangkan adalah membuat grafik sebagai PDF dan kemudian menambahkan komentar.

Idealnya saya ingin opsi untuk melakukan ini secara terprogram, sehingga jika saya mengulang grafik saya dapat 'secara otomatis' menambahkan komentar kembali.

seanv507
sumber
1
Apa yang kadang-kadang saya lakukan, Radalah menambahkan plot terpisah (pada halaman terpisah di akhir pdf) dan menggunakannya untuk pastebeberapa komentar.
hplieninger
3
Ini lebih mirip pertanyaan pemrograman dan jika saya benar Anda mungkin mendapatkan respons yang lebih baik pada R-help atau StackOverflow
mdewey
1
@mdewey, baik saya melihatnya sebagai alur kerja statistik di R - Saya setuju 'solusi yang disarankan' saya hanya 'bagaimana menulis komentar ke pdf', tapi saya berasumsi bahwa ahli statistik telah menghadapi masalah ini sebelumnya dan mungkin menyarankan pendekatan yang sama sekali berbeda untuk masalah umum melacak catatan yang terkait dengan grafik.
seanv507
3
Murid-murid saya melakukan ini tanpa diminta dengan menempelkan grafik ke dalam MS Word dan menambahkan komentar. Saya menghargai ketertarikan dalam metode otomatis semua-bernyanyi, semua-menari, tetapi beberapa kali teknologi rendah adalah teknologi terbaik.
Nick Cox
1
Saya pikir ini adalah kepentingan umum. Saya telah mengambil kebebasan mempermudah penekanan pada python / R, yang bertentangan dengan pedoman di sini.
Nick Cox

Jawaban:

5

Inilah solusi mudah yang menurut banyak orang bermanfaat. Jika Anda menganggapnya sepele, saya tidak akan setuju. Ini memotong perangkat lunak statistik, sistem operasi dan detail komputasi lainnya.

Cukup salin dan tempel grafik Anda ke pengolah kata atau teks favorit Anda dan kemudian tambahkan komentar Anda sendiri. Itu bisa berarti MS Word, perangkat lunak yang mendukung TeX, LaTeX, dll.

Itu dia. Jelas keuntungannya adalah kesederhanaan (bukan hal baru untuk dipelajari) dan fleksibilitas (tambahkan apa yang Anda inginkan dengan cara yang Anda inginkan).

Ini bukan solusi otomatis. Tetapi bahkan solusi otomatis bergantung pada pemberian informasi pada grafik dan komentar Anda, jadi apa bedanya?

Nick Cox
sumber
2
Saya pikir Anda menggarisbawahi hal itu. Jika alih-alih 'menempel' Anda menambahkan tautan ke file (seperti yang Anda bisa dalam kata lateks dll) maka saat grafik diperbarui, pembaruan dokumen - jadi 'otomatis'. Selain itu, saya menyukai kenyataan bahwa seseorang dapat memisahkan pembuatan grafik dari tata letak (mis.
Muat
3

Saya sangat merekomendasikan Jupyter Notebook , yang memungkinkan Anda membuat dokumen yang berisi blok kode, plot, dan catatan / dokumentasi. Dokumen dapat menyertakan markdown dan lateks, yang secara otomatis diberikan (seperti menulis di CrossValidated). Saat Anda menjalankan blok kode, setiap output teks dan plot yang dihasilkannya ditambahkan sebaris ke dokumen. Anda dapat mengubah blok kode dan menjalankan kembali untuk memperbarui hasil / plot. Ini bagus untuk menguji berbagai hal secara interaktif (misalnya mengubah kode / parameter untuk melihat apa yang terjadi). Saya pikir ini lebih mudah daripada harus mengekspor angka dan menempelkannya ke dokumen statis tradisional, terutama jika Anda mengubah apa pun. Anda dapat mengekspor buku catatan ke PDF, dll. Untuk mendapatkan salinan statis.

Ini open source dan bekerja dengan Python, R, dan bahasa lainnya. Antarmuka berbasis browser, sehingga lintas platform dan mudah untuk berbagi notebook. Anda dapat menjalankan backend di komputer Anda sendiri, atau Anda dapat meng-host notebook di situs web sehingga Anda / orang lain dapat mengedit / melihat / menjalankannya dari mana saja (kode akan berjalan di server). Rupanya ada cara untuk mengkonfigurasi notebook sebagai frontend ke cluster komputasi untuk komputasi paralel.

pengguna20160
sumber
Saya telah mencobanya pada banyak kesempatan, tetapi saya tidak benar-benar yakin bahwa itu bekerja dengan sangat baik: Menggabungkan kode / grafik / dokumentasi sambil memastikan semuanya dapat dibaca tampaknya sangat sulit dalam praktiknya. Saya telah melihat presentasi di mana ini telah dilakukan tetapi diduga upaya yang dilakukan cukup besar (seperti untuk presentasi apa pun). Maksud saya tentang EDA adalah bahwa Anda melakukan banyak grafik dll - terlalu banyak untuk disajikan ... dalam presentasi Anda menunjukkan yang terbaik. Akan menyambut contoh yang bertentangan dengan kesan saya.
seanv507
2

Saya cenderung melakukan lebih banyak dan lebih banyak analisis di R notebooksdalam RStudio. Dengan cara ini, saya dapat memiliki kode, anotasi, dan grafik di satu tempat dan tidak harus menghasilkan pdf sepanjang waktu - yang merupakan penghemat waktu nyata. Anda menulis teks dan kode dalam editor dan dengan mengklik tombol, kode dieksekusi (dan grafik digambar) pada tempatnya. Jadi teks, kode, dan plot tetap rapi bersama. Juga sangat mudah untuk dikonversi menjadi HTML atau PDF dengan beberapa klik mouse. Saya tidak tahu, seberapa baik ini bekerja dengan Python, karena saya kebanyakan menggunakan R.

Bernhard
sumber
2

Kedengarannya seperti Anda ingin semacam pemrograman yang melek . Rmemberi Sweave , dan Knitr antarmuka dengan LaTeX . Ada opsi lain untuk berbagai jenis format output, seperti ODFweave untuk dokumen yang dapat diedit (seperti dokumen Word), dan RMarkdown yang dapat menampilkan beberapa jenis (seperti HTML selain yang disebutkan di atas). Perangkat lunak statistik lainnya umumnya memiliki fitur analog.

(Ada sedikit pekerjaan di muka dalam menggunakan ini. Saya biasanya melakukan proyek satu kali, bukan proyek jangka panjang yang membutuhkan laporan reguler dan serupa, jadi saya biasanya menggunakan metode dumping atau menyalin @ NickCox ke file dan menulis komentar di sekitarnya.)

gung - Pasang kembali Monica
sumber
1

Dalam R: Terkadang saya menambahkan plot tambahan ke pdf dengan beberapa informasi dasar. Ini sangat berguna jika penjelasannya singkat dan terkait dengan data plot sehingga Anda dapat pasteinformasi tambahan. Sebagai contoh:

pdf("cars-plots.pdf")
plot(cars)
plot.new()
legend("center", bty = "n", legend =
           paste0("Data: 'cars'\n",
                  "cor = ", round(cor(cars)[1, 2], 2), "\n",
                  "N = ", nrow(cars), "\n",
                  Sys.Date()))
dev.off()

Atau, jika Anda memiliki anotasi yang lebih lama, menghasilkan laporan menggunakan R Markdown mungkin menjadi solusi.

hplieninger
sumber