Saya menemukan Project Euler http://projecteuler.net/ sangat berguna dalam mempelajari bahasa pemrograman. Apakah ada situs serupa untuk Pembelajaran Mesin?
Saya memang melihat http://www.kaggle.com/ , tetapi hampir tidak dapat diakses oleh pemula sebagai Project Euler.
Jawaban:
Meskipun taruhannya lebih tinggi daripada untuk Project Euler, seperti yang telah Anda tunjukkan, Kaggle adalah sumber data yang sangat baik untuk digunakan dalam eksperimen Anda sendiri. Banyak kontes mereka mengharuskan Anda masuk untuk mengakses dataset (untuk perjanjian hukum dan sebagainya), tetapi jika Anda tidak benar-benar menyelesaikan entri, tidak ada hukuman yang saya tahu.
Yang sedang berkata, jika Anda mencari set data yang khusus untuk menguji prosedur statistik, seperti yang ada di Princeton , Anda dapat menguji data pada arsitektur jaringan yang berbeda dan membandingkannya dengan regresi sederhana, dll sebagai patokan.
Lihat juga di sini untuk daftar lengkap, yang mencakup semua data pemrosesan bahasa alami Google .
Jadi, Project Euler menyediakan layanan hebat dengan masalah khusus, tetapi dalam hal pembelajaran mesin, Anda dapat menggunakan kumpulan data yang ada dengan arsitektur kreasi Anda dan membandingkan "jawaban" dengan kesimpulan yang disajikan secara online atau dalam makalah penelitian.
sumber
UCI terkenal di komunitas pembelajaran mesin untuk repositori mereka jika dataset. Banyak artikel jurnal menyertakan hasil teknik mereka pada beberapa dataset UCI, sehingga Anda dapat mencoba sendiri dan melihat bagaimana Anda melakukannya.
sumber
Bagaimana dengan: http://www.ml-class.org/ ? Ini memiliki pengantar yang bagus dan beberapa pemrograman pemrograman. AFAIK Euler memiliki banyak contoh yang lebih canggih, tetapi kelas ml masih merupakan awal yang baik.
Seperti yang ditunjukkan dalam komentar, kursus ini memiliki edisi berikutnya: http://jan2012.ml-class.org/#
sumber