Saya seorang R noob yang diharuskan untuk melakukan berbagai macam analisis pada set data besar di R. Jadi sambil melihat-lihat situs ini dan di tempat lain, tampak bagi saya bahwa ada banyak masalah esoteris dan kurang terkenal yang terlibat di sini - seperti paket mana yang digunakan kapan, transformasi apa ke (tidak) berlaku pada data dll.
Saya hanya ingin tahu apakah ada buku / tutorial / panduan yang menjelaskan semua ini dan menyajikan informasi secara sistematis? Saya lebih suka melakukan ini daripada melihat-lihat, dan mengumpulkan informasi dari berbagai sumber online.
Terima kasih sebelumnya.
r
large-data
TeachMeR
sumber
sumber
Jawaban:
Berikut adalah beberapa posting blog yang saya lakukan tentang masalah Kumpulan Data Besar dengan R. Ada beberapa paket seperti ff dan bigmemory yang menggunakan pertukaran file dan alokasi memori. Beberapa paket lain memanfaatkan konektivitas ke database seperti sqldf, RMySQL, dan RSQLite.
R Referensi untuk Menangani Data Besar
Regresi Logistik Big Data dalam R dengan ODBC
sumber