Menangani set data besar dalam R - tutorial, praktik terbaik, dll

11

Saya seorang R noob yang diharuskan untuk melakukan berbagai macam analisis pada set data besar di R. Jadi sambil melihat-lihat situs ini dan di tempat lain, tampak bagi saya bahwa ada banyak masalah esoteris dan kurang terkenal yang terlibat di sini - seperti paket mana yang digunakan kapan, transformasi apa ke (tidak) berlaku pada data dll.

Saya hanya ingin tahu apakah ada buku / tutorial / panduan yang menjelaskan semua ini dan menyajikan informasi secara sistematis? Saya lebih suka melakukan ini daripada melihat-lihat, dan mengumpulkan informasi dari berbagai sumber online.

Terima kasih sebelumnya.

TeachMeR
sumber
2
Ini bisa menjadi awal: cran.r-project.org/web/views/HighPerformanceComputing.html
Roman Luštrik
1
Mungkin membantu untuk membagikan beberapa contoh analisis seperti apa yang ingin Anda lakukan dan seperti apa data Anda. Statistik sederhana seperti cara atau regresi yang kompleks? 200 variabel melintasi seribu baris, atau 4 variabel dan 20 juta baris?
PaulHurleyuk
1
Jika Anda benar-benar memiliki dataset "besar", Anda mungkin harus melihat pada database relasional. Titik awal untuk ini bisa menjadi manual "R Data Impor / Ekspor" yang dikirimkan dengan RNB manual ini juga tersedia melalui bagian "Manuals" dari situs web R.
1
Pertama, pertanyaan penting: Apa yang Anda maksudkan secara luas, dan apa yang ingin Anda lakukan?
Fomite

Jawaban: