Pemrosesan Data yang Dipercepat GPU untuk R di Windows

11

Saat ini saya mengambil makalah tentang Big Data yang telah kami gunakan R banyak untuk analisis data. Saya kebetulan memiliki GTX1070 di PC saya untuk alasan bermain game. Jadi, saya pikir akan sangat keren jika saya bisa menggunakannya untuk mempercepat beberapa pemrosesan untuk beberapa hal yang dosen saya telah saya lakukan, tetapi sepertinya tidak mudah untuk melakukan ini sama sekali. Saya telah menginstal gpuR, CUDA, Rtools, dan beberapa bit dan bobs lainnya, dan saya bisa mendapatkannya untuk membuat objek gpuMatrix dari data ekspresi genom, misalnya, tetapi saya belum menemukan fungsi yang keduanya berfungsi dengan objek gpuMatrix dan juga memberikan perbedaan kinerja yang nyata. Mungkin ini hanya berkaitan dengan keterbatasan yang melekat pada paket gpuR - beberapa paket lain sepertinya berbicara tentang memiliki fungsi yang sepertinya lebih mirip dengan hal yang saya cari,

Hampir semua paket itu khusus untuk Linux, apakah sangat sulit untuk mengimplementasikan dukungan GPU untuk R di windows? Atau adakah alasan lain mengapa ada begitu sedikit paket yang tersedia untuk melakukan ini di Windows? Dalam beberapa hal saya hanya ingin tahu, tetapi juga akan sangat keren untuk membuatnya bekerja. Itu mengejutkan saya bahwa ada begitu sedikit tersedia untuk Windows, biasanya itu sebaliknya.

Jesse Maher
sumber
1
Saya telah menemukan komputasi GPU di Windows menjadi menantang, terlepas dari bahasa pemrogramannya. Alat-alat tersebut memiliki kecenderungan untuk dikembangkan di Linux atau OS X. Anda dapat mencoba sistem dual-boot dengan, katakanlah, Linux Mint Cinnamon (distro favorit saya saat ini, karena semuanya berfungsi).
Adrian Keister

Jawaban:

4

Dari pengalaman saya mengatur pemrosesan GPU untuk R itu sulit, pengaturannya pada mesin Windows bahkan lebih sulit. Selain itu, pemrosesan GPU hanya dapat digunakan untuk jenis perhitungan yang sangat spesifik.

Jika Anda hanya ingin mengatur pemrosesan GPU untuk itu, maka jawaban saya cukup berguna.

Namun, jika Anda peduli tentang pengoptimalan kinerja umum sistem dan kode Anda, saya sarankan untuk memeriksa langkah-langkah berikut:

  • Gunakan Microsoft R Open daripada Base R karena secara otomatis memungkinkan pemrosesan multicore pada mesin Anda.

  • Ubah kode Anda menjadi vektor

  • Gunakan pustaka seperti data.table bukan dataframe

  • Hindari menumbuhkan benda

Secara umum, kinerja R sangat bergantung pada kualitas kode Anda. Ringkasan yang sangat baik tentang apa yang dapat dan harus Anda lakukan disediakan di R Inferno oleh Patrick Burns.

jd1338
sumber
Terima kasih atas komentarnya. saya mengubah jawaban sesuai.
jd1338
Maka komentar saya tidak lagi berguna.
42-