Dalam melakukan analisis data eksplorasi, saya akan sering mencetak grafik dan menulis komentar / penjelasan dll.
Apakah orang memiliki saran untuk metodologi elektronik yang lebih baik? Saya terutama tertarik pada python / R.
Saya mencari sesuatu 'cepat (dan kotor)' yang tidak memperlambat pekerjaan eksplorasi, tetapi membantu memasukkan wawasan yang telah saya buat.
Apa yang bisa saya bayangkan adalah membuat grafik sebagai PDF dan kemudian menambahkan komentar.
Idealnya saya ingin opsi untuk melakukan ini secara terprogram, sehingga jika saya mengulang grafik saya dapat 'secara otomatis' menambahkan komentar kembali.
data-visualization
eda
project-management
seanv507
sumber
sumber
R
adalah menambahkan plot terpisah (pada halaman terpisah di akhir pdf) dan menggunakannya untukpaste
beberapa komentar.Jawaban:
Inilah solusi mudah yang menurut banyak orang bermanfaat. Jika Anda menganggapnya sepele, saya tidak akan setuju. Ini memotong perangkat lunak statistik, sistem operasi dan detail komputasi lainnya.
Cukup salin dan tempel grafik Anda ke pengolah kata atau teks favorit Anda dan kemudian tambahkan komentar Anda sendiri. Itu bisa berarti MS Word, perangkat lunak yang mendukung TeX, LaTeX, dll.
Itu dia. Jelas keuntungannya adalah kesederhanaan (bukan hal baru untuk dipelajari) dan fleksibilitas (tambahkan apa yang Anda inginkan dengan cara yang Anda inginkan).
Ini bukan solusi otomatis. Tetapi bahkan solusi otomatis bergantung pada pemberian informasi pada grafik dan komentar Anda, jadi apa bedanya?
sumber
Saya sangat merekomendasikan Jupyter Notebook , yang memungkinkan Anda membuat dokumen yang berisi blok kode, plot, dan catatan / dokumentasi. Dokumen dapat menyertakan markdown dan lateks, yang secara otomatis diberikan (seperti menulis di CrossValidated). Saat Anda menjalankan blok kode, setiap output teks dan plot yang dihasilkannya ditambahkan sebaris ke dokumen. Anda dapat mengubah blok kode dan menjalankan kembali untuk memperbarui hasil / plot. Ini bagus untuk menguji berbagai hal secara interaktif (misalnya mengubah kode / parameter untuk melihat apa yang terjadi). Saya pikir ini lebih mudah daripada harus mengekspor angka dan menempelkannya ke dokumen statis tradisional, terutama jika Anda mengubah apa pun. Anda dapat mengekspor buku catatan ke PDF, dll. Untuk mendapatkan salinan statis.
Ini open source dan bekerja dengan Python, R, dan bahasa lainnya. Antarmuka berbasis browser, sehingga lintas platform dan mudah untuk berbagi notebook. Anda dapat menjalankan backend di komputer Anda sendiri, atau Anda dapat meng-host notebook di situs web sehingga Anda / orang lain dapat mengedit / melihat / menjalankannya dari mana saja (kode akan berjalan di server). Rupanya ada cara untuk mengkonfigurasi notebook sebagai frontend ke cluster komputasi untuk komputasi paralel.
sumber
Saya cenderung melakukan lebih banyak dan lebih banyak analisis di
R notebooks
dalam RStudio. Dengan cara ini, saya dapat memiliki kode, anotasi, dan grafik di satu tempat dan tidak harus menghasilkan pdf sepanjang waktu - yang merupakan penghemat waktu nyata. Anda menulis teks dan kode dalam editor dan dengan mengklik tombol, kode dieksekusi (dan grafik digambar) pada tempatnya. Jadi teks, kode, dan plot tetap rapi bersama. Juga sangat mudah untuk dikonversi menjadi HTML atau PDF dengan beberapa klik mouse. Saya tidak tahu, seberapa baik ini bekerja dengan Python, karena saya kebanyakan menggunakan R.sumber
Kedengarannya seperti Anda ingin semacam pemrograman yang melek .
R
memberi Sweave , dan Knitr antarmuka dengan LaTeX . Ada opsi lain untuk berbagai jenis format output, seperti ODFweave untuk dokumen yang dapat diedit (seperti dokumen Word), dan RMarkdown yang dapat menampilkan beberapa jenis (seperti HTML selain yang disebutkan di atas). Perangkat lunak statistik lainnya umumnya memiliki fitur analog.(Ada sedikit pekerjaan di muka dalam menggunakan ini. Saya biasanya melakukan proyek satu kali, bukan proyek jangka panjang yang membutuhkan laporan reguler dan serupa, jadi saya biasanya menggunakan metode dumping atau menyalin @ NickCox ke file dan menulis komentar di sekitarnya.)
sumber
Dalam
R
: Terkadang saya menambahkan plot tambahan ke pdf dengan beberapa informasi dasar. Ini sangat berguna jika penjelasannya singkat dan terkait dengan data plot sehingga Anda dapatpaste
informasi tambahan. Sebagai contoh:Atau, jika Anda memiliki anotasi yang lebih lama, menghasilkan laporan menggunakan R Markdown mungkin menjadi solusi.
sumber