Saya punya daftar kecil perusahaan yang menyediakan platform untuk menjalankan skrip R, python, atau oktaf pada kluster yang dibangun di atas amazon EC2. Apakah ada nama lain yang harus saya tambahkan?
r
machine-learning
Zach
sumber
sumber
Jawaban:
Saya tidak menggunakan perusahaan-perusahaan ini, tetapi ini hanya beberapa opsi. Namun, pengaturan pada EC2 sangat sederhana. Setidaknya setelah Anda membuat mati rasa kepala Anda dengan membenturkannya ke dinding cukup keras dan cukup sering. Ini juga meningkatkan ambang rasa sakit Anda. Anak-anak sekarang ini jauh lebih mudah. Ketika saya mulai, kami melakukan komputasi kabut: kami tidak memiliki foggiest apa yang kami komputasi.
Mengesampingkan pengingat ... Ada alat dan sumber daya untuk mem-bypass vendor ini dan memulai sendiri. JD Long telah, dengan
segue
, membuatnya lebih mudah untuk mulai menggunakan R pada EMR.Mengenai Python, boto adalah rangkaian yang memungkinkan untuk menjalankan dan menjalankan Python dengan mudah di EC2. Juga cukup mudah untuk mengaktifkan dan menjalankan Python di Google AppEngine , jika Anda bersedia mempertimbangkan alternatif EC2. Jika Anda mengenal Python, maka benar-benar tidak perlu menyewa perusahaan untuk melakukan pengangkatan untuk Anda, kecuali jika Anda tidak terbiasa dengan penskalaan, pembilasan, penyeimbangan muatan, dll., Bahkan pada tingkat konseptual sekalipun. Di sisi lain, jika Anda berencana untuk menghabiskan banyak uang untuk layanan seperti itu, adalah ide yang baik untuk membiasakan diri dengan cara membuat kode Anda efisien.
Sedangkan untuk Oktaf di cloud, saya tidak tahu apa yang ada selain ketiga perusahaan ini. Monkey Analytics dulu menawarkannya, tetapi tampaknya sudah tidak ada. Saya akan merekomendasikan menghindari Octave, dan fokus pada Python atau R.
Satu sumber daya untuk membuatnya lebih mudah diatur adalah StarCluster . Sekali lagi, tidak ada pengalaman dengan mereka, tetapi itu mungkin merupakan rute yang bermanfaat.
Dalam semua kejujuran, Ubuntu (atau Windows) dan EC2 tidak terlalu sulit untuk dipelajari. Saya tidak akan merekomendasikan Windows untuk R, karena tidak ada banyak cinta di antara pengembang R dan Windows. (NB: Sejauh yang saya tahu tidak ada layanan cloud Mac OS X yang serius.) Setelah Anda memiliki desktop jarak jauh, Anda berada dalam bisnis. Belajar bagaimana mengukur adalah langkah selanjutnya.
Pembaruan 1: Lainnya, lebih umum, layanan pengelolaan cloud termasuk RighstScale dan Scalr.
Pembaruan 2: Saya ingin menekankan bahwa belajar mengatur instance dan cluster di cloud untuk Anda sendiri adalah penting. Di antara manfaat pekerjaan langsung:
gputools
)Ada manfaat menggunakan penyedia yang dikelola, seperti kurva belajar yang lebih pendek, mungkin dukungan yang lebih baik untuk berbagi sumber daya di antara suatu kelompok, dan mungkin beberapa alat yang bagus, tetapi saya tidak dapat berbicara tentang manfaatnya ketika saya mulai menggunakan EC2 sebelum semua ini datang ke pasar.
sumber
Ada juga PiCloud untuk menjalankan kode Python secara paralel di EC2.
Dari halaman produk mereka :
sumber
Apakah Anda pernah mencoba CloudStat sebelumnya? Berbeda dari cloud lain, CloudStat hanya dimaksudkan untuk pengguna Bahasa R. Tidak ada pengaturan lagi. Anda bisa masuk dan menggunakan RAM hingga 7,5 Gb secara gratis.
Namun, dengan akun gratis, analisis Anda akan dilihat dan digunakan oleh publik. Opsi ini membayar $ 5 per bulan untuk menjadikan analisis Anda pribadi.
sumber
Salah satu platform komputasi awan yang dapat saya rekomendasikan adalah Backbone yang menyediakan platform komputasi awan peningkatan produktivitas yang aman .
sumber