Platform komputasi awan untuk pembelajaran mesin [ditutup]

Jawaban:

15

Saya tidak menggunakan perusahaan-perusahaan ini, tetapi ini hanya beberapa opsi. Namun, pengaturan pada EC2 sangat sederhana. Setidaknya setelah Anda membuat mati rasa kepala Anda dengan membenturkannya ke dinding cukup keras dan cukup sering. Ini juga meningkatkan ambang rasa sakit Anda. Anak-anak sekarang ini jauh lebih mudah. Ketika saya mulai, kami melakukan komputasi kabut: kami tidak memiliki foggiest apa yang kami komputasi.

Mengesampingkan pengingat ... Ada alat dan sumber daya untuk mem-bypass vendor ini dan memulai sendiri. JD Long telah, dengansegue , membuatnya lebih mudah untuk mulai menggunakan R pada EMR.

Mengenai Python, boto adalah rangkaian yang memungkinkan untuk menjalankan dan menjalankan Python dengan mudah di EC2. Juga cukup mudah untuk mengaktifkan dan menjalankan Python di Google AppEngine , jika Anda bersedia mempertimbangkan alternatif EC2. Jika Anda mengenal Python, maka benar-benar tidak perlu menyewa perusahaan untuk melakukan pengangkatan untuk Anda, kecuali jika Anda tidak terbiasa dengan penskalaan, pembilasan, penyeimbangan muatan, dll., Bahkan pada tingkat konseptual sekalipun. Di sisi lain, jika Anda berencana untuk menghabiskan banyak uang untuk layanan seperti itu, adalah ide yang baik untuk membiasakan diri dengan cara membuat kode Anda efisien.

Sedangkan untuk Oktaf di cloud, saya tidak tahu apa yang ada selain ketiga perusahaan ini. Monkey Analytics dulu menawarkannya, tetapi tampaknya sudah tidak ada. Saya akan merekomendasikan menghindari Octave, dan fokus pada Python atau R.

Satu sumber daya untuk membuatnya lebih mudah diatur adalah StarCluster . Sekali lagi, tidak ada pengalaman dengan mereka, tetapi itu mungkin merupakan rute yang bermanfaat.

Dalam semua kejujuran, Ubuntu (atau Windows) dan EC2 tidak terlalu sulit untuk dipelajari. Saya tidak akan merekomendasikan Windows untuk R, karena tidak ada banyak cinta di antara pengembang R dan Windows. (NB: Sejauh yang saya tahu tidak ada layanan cloud Mac OS X yang serius.) Setelah Anda memiliki desktop jarak jauh, Anda berada dalam bisnis. Belajar bagaimana mengukur adalah langkah selanjutnya.


Pembaruan 1: Lainnya, lebih umum, layanan pengelolaan cloud termasuk RighstScale dan Scalr.

Pembaruan 2: Saya ingin menekankan bahwa belajar mengatur instance dan cluster di cloud untuk Anda sendiri adalah penting. Di antara manfaat pekerjaan langsung:

  • Pelajari cara mengelola campuran sumber daya (beberapa instance, beberapa tipe instance, banyak HD, zona atau wilayah ketersediaan berbeda, berbagai alat pemantauan, dan banyak lagi)
  • Bermain-main dengan GPU jika Anda mau (lihat gputools)
  • Anda dapat lebih mudah memperbarui atau memutar kembali pilihan paket Anda
  • Anda mungkin bisa mendapatkan biaya yang jauh lebih rendah dengan menggunakan mesin virtual atau mesin virtual.
  • Anda dapat mencoba berbagai GUI R atau IDE, yang mungkin bukan opsi untuk vendor cloud.

Ada manfaat menggunakan penyedia yang dikelola, seperti kurva belajar yang lebih pendek, mungkin dukungan yang lebih baik untuk berbagi sumber daya di antara suatu kelompok, dan mungkin beberapa alat yang bagus, tetapi saya tidak dapat berbicara tentang manfaatnya ketika saya mulai menggunakan EC2 sebelum semua ini datang ke pasar.

Iterator
sumber
5

Ada juga PiCloud untuk menjalankan kode Python secara paralel di EC2.

Dari halaman produk mereka :

PiCloud adalah platform cloud-computing yang terintegrasi ke dalam Bahasa Pemrograman Python. Ini memungkinkan Anda untuk meningkatkan kekuatan komputasi Layanan Web Amazon tanpa harus mengelola, memelihara, atau mengkonfigurasi server virtual.

PiCloud terintegrasi dengan mulus ke basis kode Anda yang ada melalui pustaka Python kustom, cloud. Untuk menurunkan pelaksanaan fungsi ke server kami, yang harus Anda lakukan adalah meneruskan fungsi yang Anda inginkan ke perpustakaan cloud. PiCloud akan menjalankan fungsi pada cluster berkinerja tinggi. Saat Anda menjalankan lebih banyak fungsi, gugus skala otomatis kami untuk memenuhi kebutuhan komputasi Anda. Mendapatkan di cloud tidak pernah semudah ini!

cloudartisan
sumber
Saya agak menyukai PiCloud - Saya menemukan mereka sangat mudah untuk berdiri dan berjalan.
Fomite
3

Apakah Anda pernah mencoba CloudStat sebelumnya? Berbeda dari cloud lain, CloudStat hanya dimaksudkan untuk pengguna Bahasa R. Tidak ada pengaturan lagi. Anda bisa masuk dan menggunakan RAM hingga 7,5 Gb secara gratis.

Namun, dengan akun gratis, analisis Anda akan dilihat dan digunakan oleh publik. Opsi ini membayar $ 5 per bulan untuk menjadikan analisis Anda pribadi.

Kai Feng Chew
sumber
0

Salah satu platform komputasi awan yang dapat saya rekomendasikan adalah Backbone yang menyediakan platform komputasi awan peningkatan produktivitas yang aman .

pengguna46245
sumber
Apakah mereka memiliki penawaran khusus-R? Saya tidak mencari penyedia cloud-computing umum, saya mencari penyedia yang menyediakan server R (pra-konfigurasi RStudio) yang telah dikonfigurasi sebelumnya.
Zach