Paket R apa yang menurut Anda paling berguna dalam pekerjaan sehari-hari Anda?

28

Duplikat utas: Saya baru saja menginstal versi terbaru R. Paket apa yang harus saya peroleh?

Apa paket R yang tidak bisa Anda bayangkan pekerjaan harian Anda dengan data? Harap sebutkan alat umum dan khusus.

UPDATE: Adapun 24.10.10 ggplot2tampaknya menjadi pemenang dengan 7 suara.

Paket lain yang disebutkan lebih dari satu adalah:

  • plyr - 4
  • RODBC, RMySQL- 4
  • sqldf - 3
  • lattice - 2
  • zoo - 2
  • Hmisc/rms - 2
  • Rcurl - 2
  • XML - 2

Terima kasih atas jawaban Anda!

radek
sumber
1
Pertanyaan yang sangat subyektif: pertanyaan ini tidak dapat dijawab, dan tidak cocok untuk situs QA.
Egon Willighagen
3
Mungkin seharusnya wiki komunitas; pertanyaan yang bermanfaat di sini tetapi tidak memiliki jawaban yang pasti.
Shane
2
@ Shane: poin bagus. terharu. @ Egon: subyektif memang. tetapi jika jawabannya datang dari orang-orang berpengetahuan saya tidak keberatan dosis subjektivitas. Saya sudah mulai belajar R baru-baru ini dan memiliki beberapa lusin diinstal untuk mengeksplorasi, namun saya perhatikan bahwa ada alat yang saya gunakan jauh lebih sering terlepas dari tugas yang ada.
radek
Akan menarik jika StackExchange dapat mendukung beberapa metode untuk menghubungkan posting wiki komunitas di seluruh situs. Karena saya berani bertaruh pertanyaan ini telah diajukan di Stackoverflow dan saya juga berpikir bahwa Analisis Statistik mungkin menarik beberapa orang yang biasanya tidak mengunjungi SO.
Sharpie
@Sharpie: ada beberapa posting SO yang menarik seperti stackoverflow.com/questions/1295955/… atau stackoverflow.com/questions/1535021/… namun mereka tidak fokus pada paket. dan saya setuju, hubungan komunitas wiki bisa sangat berguna.
Radek

Jawaban:

23

Saya menggunakan plyr dan ggplot2 paling banyak setiap hari.

Saya juga sangat bergantung pada paket seri waktu; terutama, paket kebun binatang .

Shane
sumber
8

Saya menggunakan paket xtable . Paket xtable mengubah tabel yang dihasilkan oleh R (khususnya, tabel yang menampilkan hasil anova) menjadi tabel LaTeX, untuk dimasukkan dalam artikel.

Mehper C. Palavuzlar
sumber
8

multicore cukup bagus untuk alat untuk membuat skrip lebih cepat lebih cepat.
cacheSweave menghemat banyak waktu saat menggunakan Sweave.

pengguna88
sumber
8

ggplot2 - visualisasi terbaik ke bawah untuk R.

RMySQL / RSQLite / RODBC - untuk menghubungkan ke database

sqldf - memanipulasi data.frame dengan query SQL

Hmisc / rms - paket dari Frank Harrell yang berisi fungsi lain-lain yang nyaman dan fungsi yang bagus untuk analisis regresi.

GenABEL - paket yang bagus untuk studi asosiasi genome

Rcmdr - GUI yang layak untuk R jika Anda membutuhkannya.

Lihat juga CRANtastic - tautan ini memiliki daftar paket R yang paling populer. Banyak di bagian atas daftar sudah ada

Stephen Turner
sumber
8

data.table adalah favorit saya sekarang! Sangat menantikan versi baru dengan lebih banyak wishlist diimplementasikan.

Branson
sumber
6

Bagi saya pribadi, saya paling sering menggunakan tiga paket berikut, semua tersedia dari Proyek Omega yang luar biasa untuk Komputasi Statistik (saya tidak mengklaim sebagai seorang ahli, tetapi untuk tujuan saya mereka sangat mudah digunakan):

  • RCurl : Ini memiliki banyak opsi yang memungkinkan akses ke situs web bahwa fungsi-fungsi default di basis R akan mengalami kesulitan dengan saya pikir itu adil untuk dikatakan. Ini adalah antarmuka-R ke perpustakaan libcurl, yang memiliki manfaat tambahan dari seluruh komunitas di luar R yang mengembangkannya. Juga tersedia di CRAN .

  • XML : Ini sangat memaafkan parsing XML / HTML cacat. Ini adalah antarmuka-R ke perpustakaan libxml2 dan sekali lagi memiliki manfaat tambahan dari seluruh komunitas di luar R yang mengembangkannya. Juga tersedia di CRAN .

  • RJSONIO : Ini memungkinkan seseorang untuk mem-parsing teks yang dikembalikan dari panggilan json dan mengaturnya ke dalam struktur daftar untuk analisis lebih lanjut. Pesaing untuk paket ini adalah rjson tetapi yang ini memiliki keuntungan menjadi vektor, siap diperluas melalui S3 / S4, cepat dan terukur ke data besar.
Tony Breyal
sumber
6

Sweave memungkinkan Anda menanamkan kode R dalam dokumen LaTeX. Hasil dari mengeksekusi kode, dan secara opsional kode sumber, menjadi bagian dari dokumen akhir.

Jadi alih-alih, misalnya, menempelkan gambar yang dihasilkan oleh R ke dalam file LaTeX, Anda dapat menempelkan kode R ke dalam file dan menyimpan semuanya di satu tempat.

John D. Cook
sumber
4
Sekedar petunjuk bagi semua yang ingin memulai penelitian yang dapat direproduksi dengan R. Saya akan menyarankan Anda untuk melihat-lihat paket yang agak baru knitrdaripada Sweave. Ini pada dasarnya berkeringat dengan steroid. Mudah, jika tidak mudah, untuk belajar dan jauh lebih fleksibel.
Christoph_J
4

kebun binatang dan xts adalah suatu keharusan dalam pekerjaan saya!

Dr G
sumber
4

Saya menemukan kisi bersama dengan buku pendamping "Lattice: Visualisasi Data Multivariat dengan R" oleh Deepayan Sarkar sangat berharga.

NPE
sumber
4

Jika Anda melakukan segala jenis pemodelan prediktif, tanda sisipan adalah anugerah. Terutama dikombinasikan dengan paket multicore , beberapa hal yang luar biasa mungkin terjadi.

Zach
sumber
4

Sehari-hari paket yang paling berguna haruslah "asing" yang memiliki fungsi untuk membaca dan menulis data untuk paket statistik lainnya misalnya Stata, SPSS, Minitab, SAS, dll. Bekerja di bidang di mana R tidak biasa berarti bahwa ini adalah paket yang sangat penting.

Graham Cookson
sumber
3

saya menggunakan

mobil, doBy, Epi, ggplot2, gregmisc (gdata, gmodels, gplot, gtools), Hmisc, plyr, RCurl, RDCOMClient, membentuk kembali, RODBC, TeachingDemos, XML.

banyak.

esco
sumber
3

Saya tidak bisa hidup tanpa:

  • kisi untuk grafik
  • xlsx atau XLConnect untuk membaca file Excel
  • rtf untuk membuat laporan dalam format rtf (saya lebih suka Sword atau R2wd tetapi saya tidak dapat menginstal statconn di tempat kerja; saya pasti akan mencoba odfWeave segera .)
  • nlme dan lme4 untuk model campuran
  • ff untuk bekerja dengan array besar
Stéphane Laurent
sumber
2

RODBC untuk mengakses data dari database, sqldf untuk melakukan query SQL sederhana pada dataframe (walaupun saya memaksa diri saya untuk menggunakan perintah R asli), dan ggplot2 dan plyr

wahalulu
sumber
2

Saya bekerja dengan R dan MATLAB dan saya menggunakan R.matlab banyak untuk mentransfer data di antara keduanya.

Peter Mortensen
sumber
2

Kami kebanyakan menggunakan:

  • ggplot - untuk grafik
  • statistik
  • e1071 - untuk SVM
mohans
sumber
Anda mungkin juga ingin memeriksa kernlab dan tanda sisipan untuk SVM. Mereka adalah alternatif yang menarik (dianggap belum tentu lebih baik).
Zach
2

kisi, mobil, MASSA, asing, pesta.

Peter Flom - Pasang kembali Monica
sumber
2

Bagi saya, saya menggunakan kernlab untuk Lab Pembelajaran Mesin berbasis kernel dan e1071 untuk SVM dan ggplot2 untuk grafik

404Dreamer_ML
sumber
2

Saya sering menggunakan ggplot2, vegan, dan membentuk kembali.

EDI
sumber
2

Saya suka roxygen untuk fungsi Curry () -nya.

charles.y.zheng
sumber
2

RColorBrewer belum disebutkan di sini, saya sering menggunakannya untuk merencanakan jika saya perlu skema warna

Arne Jonas Warnke
sumber
2

Saya penggemar berat RCPP ketika saya membutuhkan loop cepat untuk melakukan perawatan yang tidak sesuai R. Ini sangat baik diimplementasikan dalam sistem R eco, dapat menerima Matriks / Matriks jarang tanpa konversi sebagai argumen dalam suatu fungsi.

Sintaks C ++ mudah ketika Anda melakukan hal-hal sederhana (yang sering kali menjadi kasus saya).

Sungguh, Anda tidak perlu menjadi pembuat paket untuk membutuhkan lib yang luar biasa ini.

Apakah saya mengatakan C ++ sangat cepat?

pommedeterresautee
sumber
2

Paket doParallel dan foreach telah membuat hidup saya jauh lebih mudah dengan memungkinkan saya untuk memparalelkan kode saya dan menjalankannya pada instance komputasi yang dioptimalkan di Amazon EC2 ! Saya sangat sering menggunakannya. Tapi itu tidak akan mungkin terjadi tanpa RStudio AMI yang dirilis oleh Louis Aslett. Akhirnya, saya harus menyebutkan paket stringr yang benar-benar membuat bekerja dengan string berjalan-jalan di taman. Gunakan di setiap aplikasi penambangan teks. Dan saya juga sering menggunakan rajutan untuk menghasilkan laporan berkualitas tinggi tentang pekerjaan saya. Terima kasih banyak untuk paket luar biasa ini Yihui Xie!

Antoine
sumber
1

Saya menggunakan ggplot2, membentuk kembali, kisi, rajutan lebih sering.

Jdbaba
sumber