Saya ingin belajar tentang teori probabilitas, mengukur teori dan akhirnya mempelajari mesin. Tujuan utama saya adalah menggunakan pembelajaran mesin dalam sebuah perangkat lunak.
Saya belajar kalkulus dan probabilitas yang sangat mendasar di perguruan tinggi, tetapi cukup banyak. Apakah Anda tahu beberapa kursus online atau buku yang bisa saya gunakan untuk belajar tentang mata pelajaran ini. Saya telah menemukan banyak sumber di web tetapi semuanya tampaknya ditargetkan untuk audiens yang ahli. Saya tahu ini akan memakan waktu tetapi di mana saya mulai jika saya ingin belajar dari awal?
Jawaban:
Saya pikir ada dua referensi yang sangat bagus dan populer untuk Anda (saya mulai dengan yang ini juga memiliki latar belakang master dalam ilmu aktuaria):
Pengantar Pembelajaran Statistik (dengan aplikasi dalam R) oleh Gareth James, Daniela Witten, Trevor Hastie, Robert Tibshirani. Ini tersedia secara gratis di situs, cukup komprehensif dan mudah dimengerti dengan contoh-contoh praktis. Anda dapat mulai belajar banyak hal bahkan tanpa latar belakang statistik yang sangat kuat, referensi ini bagus untuk berbagai profil dan menyertakan sejumlah algoritma populer yang memadai bersama dengan implementasinya dalam R tanpa masuk jauh ke dalam rincian matematis.
Elemen Pembelajaran Statistik oleh Trevor Hastie, Robert Tibshirani, Jerome Friedman . Dibandingkan dengan yang pertama, buku ini masuk lebih dalam ke aspek matematika jika Anda ingin mengeksplorasi lebih lanjut tentang algoritma tertentu yang Anda anggap berguna bagi Anda. ( gratis juga)
Dan tentu saja Cross Validated adalah salah satu sumber terbaik di mana Anda dapat belajar banyak hal, bagi saya: praktik terbaik, kesalahpahaman statistik dan penyalahgunaan, dan banyak lagi. Setelah beberapa tahun belajar di sekolah / universitas serta belajar seft, saya menemukan bahwa pengetahuan saya terlalu terbatas ketika saya pertama kali pergi ke Cross Validated. Saya terus pergi ke sini setiap hari sejak kunjungan pertama dan belajar banyak.
sumber
Berikut adalah beberapa kursus online gratis yang saya dengar sangat disarankan:
sumber
Anda tidak perlu mengukur teori. Teori ukuran digunakan oleh ahli matematika untuk membenarkan prosedur matematika lainnya misalnya mengambil batasan perkiraan integral. Kebanyakan insinyur tidak akan mempelajari teori ukuran, mereka hanya akan menggunakan hasilnya. Pengetahuan matematika yang diperlukan untuk ML secara kasar ditandai dengan mampu mengintegrasikan Gaussian multivariat - Jika Anda yakin tentang hal itu maka Anda mungkin memiliki kalkulus multivariabel, aljabar linier, dan latar belakang teori probabilitas yang diperlukan.
Saya akan merekomendasikan Think Stats oleh Allen Downey - yang bertujuan untuk mengajarkan probabilitas / statistik kepada programmer. Idenya adalah untuk meningkatkan keahlian pemrograman untuk melakukan simulasi dan karenanya memahami teori probabilitas / metode statistik. allen downey blog (dia telah menulis yang lain) Pikirkan statistik (gratis) pdf )
sumber
Karena Anda tertarik dalam pembelajaran mesin, saya akan melewatkan probabilitas dan mesaure, dan melompat langsung ke ML. Kursus Andrew Ng adalah tempat yang bagus untuk memulai. Anda benar-benar dapat menyelesaikannya dalam dua minggu.
Bermainlah dengan apa yang telah Anda pelajari selama beberapa minggu, kemudian kembali ke akar dan pelajari beberapa kemungkinan. Jika Anda seorang insinyur, maka saya bingung dengan bagaimana Anda berhasil masuk kuliah. Itu dulu kursus yang diperlukan dalam rekayasa. Bagaimanapun, Anda dapat mengejar ketinggalan dengan mengikuti kursus MIT OCW di sini .
Saya tidak berpikir Anda perlu mengukur teori. Tidak ada yang perlu mengukur teori. Mereka yang melakukannya, mereka tidak akan datang ke sini untuk bertanya, karena penasihat mereka akan memberi tahu mereka jalan mana yang harus diambil. Jika Anda tidak memiliki penasihat maka Anda pasti tidak membutuhkannya. Tautologi, tetapi benar.
Hal dengan teori ukuran adalah bahwa Anda tidak dapat mempelajarinya dengan "membaca mudah". Anda harus melakukan latihan dan masalah, pada dasarnya, lakukan dengan cara yang sulit. Itu hampir mustahil di luar ruang kelas, menurut saya. Pilihan terbaik di sini adalah mengambil kelas di perguruan tinggi setempat, jika mereka menawarkannya. Terkadang, program tingkat probabilitas PhD akan melakukan pengukuran dan probabilitas dalam satu kelas, yang mungkin merupakan kesepakatan terbaik. Saya tidak akan merekomendasikan mengambil kelas teori ukuran murni di departemen Matematika, kecuali jika Anda benar-benar ingin menyiksa diri sendiri, meskipun pada akhirnya Anda akan sangat puas.
sumber
Untuk pembelajaran mesin, saya pikir Machine Learning: Seni dan Ilmu Algoritma yang Masuk Akal dari Data oleh Peter Flach bisa menjadi sumber yang baik untuk memulai. Ini memberikan pengantar umum untuk pembelajaran mesin dengan contoh-contoh intuitif, dan cocok untuk pemula. Saya suka buku ini terutama karena bab terakhir, yang membahas eksperimen pembelajaran mesin. Sementara belajar tentang pembelajaran mesin, mengenal model-model yang berbeda tidaklah cukup, dan seseorang harus dapat membandingkan algoritma pembelajaran mesin yang berbeda. Saya pikir buku ini telah membuatnya lebih mudah untuk memahami bagaimana membandingkan algoritma tersebut. Slide kuliah dapat ditemukan di sini .
sumber
Untuk menambah saran bagus di atas, saya akan mengatakan jika Anda tertarik untuk mendapatkan pemahaman yang kuat tentang konsep yang lebih mendasar dalam probabilitas dan statistik, "Dari Algoritma ke Skor Z: Komputasi Statistik dalam Statistik" adalah primer yang sangat baik dalam menggunakan komputer untuk memahami beberapa konsep pemula / menengah yang paling penting dalam teori probabilitas dan proses stokastik. Saya juga akan kedua "Pengantar Pembelajaran Statistik" atau "Elemen Pembelajaran Statistik" (ESL) sebagai pengantar pembelajaran mesin (ML). Saya pikir ESL pada khususnya luar biasa, tetapi itu mengambil lebih banyak matematika-berat pada konsep ML, jadi jika Anda hanya menganggap diri Anda "baik-baik saja" pada statistik, Anda mungkin ingin membacanya setelah Anda mendapatkan lebih banyak pengalaman dengan ML.
Jika Anda tertarik dengan Pembelajaran Mesin demi dipekerjakan atau menyelesaikan masalah, mendapatkan pengalaman langsung adalah kuncinya. Ambil beberapa pengantar mata pelajaran ilmu data / pembelajaran mesin. Andrew Ng melakukan pengantar pembelajaran mesin yang luar biasa dalam kursusnya di Coursera di sini . Saya juga menyarankan Anda mengunduh beberapa dataset dan mulai bermain-main dengannya. Jika Anda belum melakukannya, unduh R dan RStudio (menurut saya, lebih ramah untuk pemula daripada Python atau Matlab), dan mendaftar di kaggle dan lakukan beberapa masalah pemula mereka. Mereka memiliki langkah-langkah hebat yang dapat membuat Anda menggunakan ML dengan dasarnya tidak tahu apa yang sebenarnya terjadi, tetapi itu memberi Anda gambaran tentang jenis langkah yang harus Anda ambil untuk benar-benar menerapkan solusi ML.
Saya pribadi mendorong kombinasi memulai menggunakan alat ML tanpa benar-benar mengetahui apa yang mereka lakukan (menggunakan dataset Kaggle atau yang serupa); dan mempelajari konsep dasar seperti validasi silang, overfitting, menggunakan matriks kebingungan, ukuran berbeda tentang seberapa baik model, dll. Bagi saya, jauh lebih penting untuk mengetahui cara menggunakan algoritme, dan mengetahui cara mengidentifikasi ketika sesuatu bekerja Saya tidak bekerja, daripada memahami bagaimana algoritma bekerja.
sumber