Saya mencoba menyusun kurikulum matematika mandiri untuk mempersiapkan pembelajaran penambangan data dan pembelajaran mesin. Ini dimotivasi dengan memulai kelas pembelajaran mesin Andrew Ng di Coursera dan merasa bahwa sebelum melanjutkan saya perlu meningkatkan keterampilan matematika saya. Saya lulus dari perguruan tinggi beberapa saat yang lalu sehingga aljabar dan statistik saya (khususnya dari kelas ilmu politik / psikologi) berkarat.
Jawaban di utas Apakah latar belakang yang kuat dalam matematika merupakan persyaratan total untuk ML? hanya menyarankan buku atau kelas yang terkait langsung dengan pembelajaran mesin; Saya sudah melihat beberapa kelas dan buku-buku itu dan tidak tahu persis mata pelajaran matematika apa yang harus dipelajari (misalnya: bidang apa dari alamat matematika yang menurunkan persamaan untuk "meminimalkan fungsi biaya"?). Utas lainnya menyarankan ( Keterampilan & kursus perlu menjadi analis data ) hanya menyebutkan kategori luas keterampilan yang diperlukan untuk menganalisis data. Utas Pengantar statistik untuk ahli matematika tidak berlaku karena saya belum memiliki gelar dalam matematika; ahli matematika yang serupa menginginkan pengetahuan yang setara untuk tingkat statistik yang berkualitas memiliki daftar buku statistik yang luar biasa, tetapi sekali lagi, saya melihat memulai matematika dari ingatan aljabar yang berkarat dan bergerak naik dari sana.
Jadi, bagi mereka yang bekerja dalam pembelajaran mesin dan data mining, bidang matematika apa yang menurut Anda penting untuk melakukan pekerjaan Anda? Mata pelajaran matematika apa yang akan Anda sarankan untuk persiapan penambangan data dan pembelajaran mesin, dan dalam urutan apa? Inilah daftar dan pesanan yang saya miliki sejauh ini:
- Aljabar
- Pra-kalkulus
- Kalkulus
- Aljabar linier
- Kemungkinan
- Statistik (banyak sub-bidang berbeda di sini, tetapi tidak tahu bagaimana memecahnya)
Sedangkan untuk penambangan data dan pembelajaran mesin, melalui pekerjaan saya saat ini, saya memiliki akses ke catatan di situs web / aktivitas aplikasi, transaksi pelanggan / berlangganan, dan data real estat (baik statis maupun time-series). Saya berharap untuk menerapkan penambangan data dan pembelajaran mesin pada dataset ini.
Terima kasih!
EDIT:
Demi anak cucu, saya ingin berbagi penilaian mandiri matematika yang membantu untuk kelas Pengantar Mesin Pembelajaran Geoffrey Gordon dari Alex Smola di CMU.
sumber
Jawaban:
Saran yang @gung buat tentu layak ditindaklanjuti. Setelah menyelesaikan kursus coursera, saya pikir daftar Anda adalah awal yang baik. Beberapa komentar:
sumber
Ada beberapa utas bagus di forum ini - termasuk SATU INI yang menurut saya sangat membantu bagi saya dalam hal mengembangkan garis besar konseptual keterampilan penting untuk pekerjaan ilmu data.
Seperti disebutkan di atas, ada banyak kursus online yang tersedia. Misalnya Coursera sekarang memiliki Spesialisasi Ilmu Data dengan sejumlah program yang mungkin akan mencakup beberapa alat yang Anda perlukan untuk pekerjaan Anda.
sumber
Jika Anda ingin melakukan pembelajaran mesin / penambangan data, saya akan sangat menyarankan optimasi / aljabar linier / statistik dan probabilitas. Berikut adalah daftar buku probabilitas. Semoga itu bisa membantu.
sumber
Sejauh menyikat keterampilan matematika yang sangat mendasar, saya menggunakan buku-buku ini:
Elemen Matematika untuk Ekonomi dan Keuangan. Mavron, Vassilis C., Phillips, Timothy N Buku-buku ini mencakup keterampilan matematika yang penting (penambahan substraksi), hingga diferensiasi parsial, integrasi, matriks dan penentu, dan bab kecil tentang optimasi, dan juga persamaan diferensial. Ini ditargetkan untuk ekonomi dan keuangan, tetapi ini adalah sebuah buku kecil, urutan bab yang sesuai dengan kebutuhan saya, dan mudah dibaca untuk saya.
Analisis Statistik: Microsoft Excel 2010. Conrad Carlberg Meliputi analisis statistik dasar, regresi berganda, dan analisis kovarian, dan menggunakan excel.
Menemukan Statistik Menggunakan R. Andy Field, Jeremy Miles, Zoë Field. Belum membacanya. Ini menggunakan R.
Aljabar Linier Dasar. Ron Larson, David C. Falvo.
Metode Matriks: Aljabar Linier Terapan Oleh Richard Bronson, Gabriel B. Costa. mencakup aljabar linier dasar dan kalkulus matriks
Itu adalah buku matematika dasar yang saya gunakan untuk berhubungan dengan penambangan data / pembelajaran mesin
Semoga ini membantu
sumber
Ada cukup banyak sumber daya yang relevan terdaftar (dan dikategorikan) di sini , di apa yang disebut "Open Source Data Science Masters".
Khusus untuk matematika mereka daftar:
Rekomendasi yang cukup umum, meskipun mereka mencantumkan beberapa buku pelajaran yang mungkin bermanfaat bagi Anda.
sumber
sumber
Aljabar Linier, Statistik, Kalkulus. Saya pikir Anda dapat mempelajarinya bersama-sama w / ML - atau bahkan setelah dasar-dasar. Kursus-kursus awal / buku-buku melakukan pekerjaan yang baik dengan bab-bab primer matematika, dan Anda belajar hal-hal penting matematika sambil belajar ML. Saya membuat episode podcast tentang matematika yang Anda butuhkan untuk pembelajaran mesin, dan sumber daya untuk mempelajarinya: Panduan Pembelajaran Mesin # 8
sumber
Sebelum Memulai kursus pembelajaran mesin apa saja, ikuti kursus matematika berikut. Juga jangan mencoba menggali dalam upaya tunggal. Pelajari konsep dasar dan sekali lagi tingkatkan keterampilan matematika Anda dan ulangi: -
Topik Matematika adalah sebagai berikut: -
sumber