Apa cara terbaik untuk mempelajari dasar-dasar probabilitas yang diperlukan untuk algoritma pembelajaran mesin?

13

Saya mengambil kursus probabilitas di universitas beberapa tahun yang lalu, tetapi saya akan melalui beberapa algoritma pembelajaran mesin sekarang dan beberapa matematika hanya membingungkan.

Khususnya sekarang, saya sedang mempelajari algoritma EM (ekspektasi maksimisasi) dan tampaknya ada keterputusan yang besar antara apa yang diperlukan dan apa yang saya miliki.

Saya tidak meminta buku atau situs web, tetapi bagaimana cara mempelajari cukup banyak topik-topik ini untuk bisa mendapatkan pemahaman menyeluruh tentang algoritma yang menggunakannya? Apakah diharuskan membaca buku dan melakukan ratusan latihan? Atau apakah itu berlebihan dalam pengertian ini?

edit: Jika ini adalah lokasi yang salah untuk pertanyaan ini, silakan pilih untuk bermigrasi :)

kopi
sumber
Tidak mengetahui CV! Apakah ada cara untuk memindahkan pertanyaan ke sana?
2
Saya telah memilih untuk bermigrasi. :)
JM bukan ahli statistik
Cara terbaik untuk mempelajari sesuatu adalah memecahnya menjadi potongan-potongan kecil. Mengapa tidak bertanya di situs ini tentang satu atau dua pertanyaan atau konsep spesifik yang mengganggu Anda?
charles.y.zheng

Jawaban:

6

Banyak buku dan pengantar online untuk pembelajaran mesin memberikan sedikit pengantar untuk probabilitas yang mereka butuhkan dalam konten mereka, jadi saya akan mulai dengan satu atau beberapa buku untuk jenis itu. Dari atas kepala saya, saya bisa memikirkan Pengakuan Pola Statistik (mungkin karena saya belajar EM di sana) dan Elemen Pembelajaran Statistik .

Saran saya yang sebenarnya adalah Tutorial Penambangan Data Statistik oleh Andrew Moore. Itu adalah situs yang menjembatani kesenjangan yang saya miliki sebelum saya memulai PhD (berasal dari latar belakang teknik). Saya tahu Anda mengatakan Anda tidak bertanya tentang situs web, tetapi lihatlah Probabilitas untuk Penambang Data di sana dan kemungkinan lainnya meluncur sebelum Anda memutuskan. Dan lihatlah Model Gaussian Mixture untuk EM.

Apakah diharuskan membaca buku dan melakukan ratusan latihan?

Saya kira tidak. Perhitungan probabilitas dalam pembelajaran mesin cenderung mengelompok di sekitar beberapa jalur terkenal. Memiliki pemahaman yang kuat tentang distribusi Gaussian tunggal dan multidimensi dan mempelajari beberapa penjelasan EM harus membuat Anda cukup jauh. Dan aljabar linier. Anda akan membutuhkan banyak aljabar linier.

Muhammad Alkarouri
sumber
-3

Inteligensi buatan telah menjadi penting dalam dekade terakhir dengan banyak tergantung pada pengembangan dan integrasi AI dalam kehidupan kita sehari-hari. Kemajuan yang telah dibuat AI sangat mengejutkan dengan mobil self-driving, diagnosis medis dan bahkan bertaruh manusia di game strategi seperti Go and Chess.

Masa depan untuk AI sangat menjanjikan dan tidak jauh dari ketika kita memiliki teman robot kita sendiri. Ini telah mendorong banyak pengembang untuk mulai menulis kode dan mulai mengembangkan untuk program AI dan ML. Namun, belajar menulis algoritma untuk AI dan ML tidak mudah dan membutuhkan pemrograman dan pengetahuan matematika yang luas.

Matematika memainkan peran penting karena membangun fondasi untuk pemrograman untuk dua aliran ini.

Ada banyak alasan mengapa matematika penting untuk pembelajaran mesin. Beberapa di antaranya adalah di bawah ini:

Memilih algoritma yang tepat yang mencakup pertimbangan akurasi, waktu pelatihan, kompleksitas model, jumlah parameter dan jumlah fitur. Memilih pengaturan parameter dan strategi validasi. Identifikasi underfitting dan overfitting dengan memahami tradeoff Bias-Variance. Memperkirakan interval kepercayaan yang tepat dan ketidakpastian.

Jenis matematika apa yang diperlukan untuk pembelajaran mesin?

Matematika mutlak diperlukan untuk mempelajari Pembelajaran Mesin atau Kecerdasan Buatan. Pemahaman yang lebih dalam tentang konsep dan algoritma dalam ML membutuhkan pengetahuan matematika dasar.

Tiga teori matematika utama: Aljabar Linier, Kalkulus Multivariat, dan Teori Probabilitas.

Aljabar linier -

Notasi aljabar linier digunakan dalam Pembelajaran Mesin untuk menggambarkan parameter dan struktur algoritma pembelajaran mesin yang berbeda. Ini membuat aljabar linier suatu keharusan untuk memahami bagaimana jaringan saraf disatukan dan bagaimana mereka beroperasi.

Ini mencakup topik-topik seperti:

Skalar, Vektor, Matriks, Tensor, Matriks, Norma Matriks dan Vektor Khusus, Nilai Eigen dan vektor Eigen, Kalkulus Multivarian -

Ini digunakan untuk melengkapi bagian pembelajaran pembelajaran mesin. Inilah yang digunakan untuk belajar dari contoh, memperbarui parameter dari model yang berbeda dan meningkatkan kinerja.

Ini mencakup topik-topik seperti:

Derivatif, Integral, Gradien, Diferensial, Operator, Optimasi, Teori Kemungkinan Cembung -

Teori-teori tersebut digunakan untuk membuat asumsi tentang data yang mendasarinya ketika kita sedang merancang algoritma pembelajaran mendalam atau AI ini. Penting bagi kita untuk memahami distribusi probabilitas utama,

Ini mencakup topik-topik seperti:

Elemen Peluang Variabel Acak Distribusi Varians dan Harapan Variabel Acak Spesial Bagaimana cara belajar Matematika untuk Pembelajaran Mesin dengan cepat?

Cara self-starter belajar matematika untuk ilmu data adalah belajar dengan "melakukan apa-apa." Meski begitu, Anda akan ingin belajar atau meninjau teori yang mendasari di muka. Anda tidak perlu membaca seluruh buku teks, tetapi Anda ingin mempelajari konsep-konsep utama terlebih dahulu.

Sebagai prasyarat lunak, saya menganggap kenyamanan dasar dengan aljabar linier / kalkulus matriks (sehingga Anda tidak terjebak pada notasi) dan probabilitas pengantar.

Jika Anda ingin belajar matematika untuk mempelajari mesin secara mendalam, maka ada sejumlah kursus yang tersedia secara online, seperti,

Aljabar Linier Khan Academy, Probabilitas & Statistik, Kalkulus Multivariabel, dan Optimalisasi.

Yayasan Matematika Untuk Pembelajaran Mesin dan AI pada eduonix

Pelajari Mesin Belajar Matematika Dibalik udemy

Coding the Matrix: Aljabar Linier melalui Aplikasi Ilmu Komputer oleh Philip Klein, Brown University.

Buku Larry Wasserman - Semua statistik: Kursus Singkat dalam Inferensi Statistik.

Ingatlah bahwa Anda belajar yang terbaik dengan melakukan, dan sayangnya kursus ini tidak mengandung cukup tugas dan pekerjaan rumah

Apa yang saya sarankan adalah, Yayasan Matematika Untuk Pembelajaran Mesin dan AI - Kursus ini bukan kurikulum matematika lengkap; itu tidak dirancang untuk menggantikan pendidikan matematika sekolah atau perguruan tinggi. Sebaliknya, ini berfokus pada konsep-konsep matematika utama yang akan Anda temui dalam studi pembelajaran mesin.

Apa yang akan Anda pelajari:

Dan banyak lagi……

Pada akhir kursus ini, Anda tidak hanya memiliki pengetahuan untuk membangun algoritma Anda sendiri, tetapi juga rasa percaya diri untuk benar-benar mulai menempatkan algoritma Anda untuk digunakan dalam proyek Anda berikutnya.

Kursus ini juga dilengkapi dengan proyek dan kuis untuk membantu memperkuat pengetahuan Anda tentang konsep matematika.

Ini dirancang untuk mengisi kekosongan bagi siswa yang melewatkan konsep-konsep kunci ini sebagai bagian dari pendidikan formal mereka, atau yang perlu menyegarkan ingatan mereka setelah lama istirahat dari belajar matematika.

Saya pikir kursus ini jauh lebih baik daripada menginvestasikan 2 hingga 3 bulan membaca sekilas materi di awal dan kemudian melupakan setengah dari apa yang Anda pelajari pada saat Anda menemukannya.

Cobalah untuk memahami konsep-konsep dasar yang ditunjukkan dan selalu ingat untuk bersenang-senang!

Richard smith
sumber