Saya seorang insinyur Ilmu Komputer tanpa latar belakang statistik atau matematika tingkat lanjut.
Saya sedang mempelajari buku Python Machine Learning oleh Raschka dan Mirjalili, tetapi ketika saya mencoba memahami matematika dari Machine Learning, saya tidak dapat memahami buku hebat yang disarankan seorang teman kepada saya The Elements of Statistics Learning .
Apakah Anda tahu statistik dan buku matematika yang lebih mudah untuk Pembelajaran Mesin? Jika tidak, bagaimana saya harus pindah?
Jawaban:
Meskipun Anda membutuhkan buku, saya merekomendasikan kursus berikut masing-masing untuk memahami statistik yang digunakan untuk pembelajaran mesin dan tugas-tugas lain dalam ilmu data. Mereka bebas.
Jika saya ingin merekomendasikan buku, saya akan merekomendasikan buku berikut yang gratis di bawah lisensi CC . Ini memiliki contoh yang bagus dan sangat praktis; selain itu, ada banyak kode di dalamnya yang membantu Anda merasakan statistik dalam contoh dunia nyata.
Pikirkan Python oleh Allen B. Downey
Buku Pegangan Ilmu Data Python
Juga tautan berikut dapat membantu:
sumber
Pengantar Aljabar Linier https://math.mit.edu/~gs/linearalgebra/ adalah titik awal yang baik. Pastikan Anda baik dengan Teori Probabilitas, Aljabar Linier, dan Statistik. Pengetahuan yang sangat mendalam mungkin tidak diperlukan tetapi memiliki pengetahuan yang baik diperlukan.
sumber
Sebelum melakukan master saya di Analytics, saya disarankan oleh senior saya untuk membaca beberapa buku ini untuk mengetahui lebih lanjut tentang Pembelajaran Mesin dan Statistik.
Yaitu:
Jika Anda tidak dapat menemukan buku-buku ini secara online, beri tahu saya akan membagikan tautannya, saya memilikinya di drive saya. Buku-buku ini membantu saya memahami dasar-dasar statistik dengan contoh-contoh yang dijelaskan dalam istilah awam.
Jika Anda mencari beberapa kursus online, beri tahu saya dapat menyarankan Anda beberapa kursus yang baik (kebanyakan dari mereka gratis).
sumber
Saya tidak bisa mengatakan dari pertanyaan Anda seberapa mahir Anda di matematika atau di mana pembelajaran Anda berhenti. Saya akan berasumsi karena Anda adalah insinyur perangkat lunak komputer yang Anda kenal dengan aljabar, geometri, dan mungkin beberapa kalkulus.
Saya akan merekomendasikan Anda memulai pembelajaran Anda dengan membaca statistik dan memahami konsep-konsep seperti deskripsi, analisis data eksplorasi, korelasi, distribusi, dan sebagainya. Saya melihat bahwa Anda lebih suka buku daripada video, jadi saya akan menemui Anda setengah jalan dan memberi Anda beberapa buku yang sedang online, serta satu atau dua buku yang dapat Anda beli dalam bentuk cetak.
Pertama, saya akan merekomendasikan kurikulum kursus pascasarjana online Penn State dalam statistik . Anda dapat menjelajahi setiap program mereka menggunakan menu di sebelah kiri. Setelah Anda memilih kursus, gulir ke bawah pada halaman web kursus dan klik pada tautan yang bertuliskan "catatan kursus online". Catatan kursus untuk kursus-kursus ini lebih dari sekadar catatan dan dibaca seperti buku lengkap. Mereka sangat instruktif. Juga, periksa kurikulum kursus sarjana online Penn State dalam statistik , juga, jika Anda menemukan sesuatu dalam kursus pascasarjana yang terlalu maju dan ingin penjelasan "lebih sederhana".
Kedua, tinjau Buku Pegangan Statistik Biologis oleh John H. McDonald. Jangan biarkan judul itu menipu Anda; buku ini adalah primer yang sangat baik tentang statistik dan analisis data yang berlaku untuk domain apa pun.
Ketiga, tinjau The Little Handbook of Statistics oleh Gerard Dallal. Sekali lagi, jangan biarkan judul itu menipu Anda; buku ini adalah permata lain yang menuntun Anda melalui beberapa fundamental statistik penting.
Keempat, lihat buku Think Stats oleh Allen Downey. Ada versi online gratis dari edisi sebelumnya; edisi terbaru yang harus Anda beli. Itu sangat berharga, terutama jika Anda bekerja dengan Python. Dalam buku ini, penulis mengajarkan Anda statistik dan analisis data menggunakan Python untuk menganalisis set data dunia nyata (mainan). Ini adalah buku yang sangat bagus untuk dikerjakan.
Terakhir, periksa Ilmu Data dari Awal oleh Joel Grus. Buku ini lebih berfokus pada analisis data (bukan fundamental statistik) dan lebih menekankan pembelajaran mesin dan pemodelan. Itu menggunakan Python (dan tumpukan ilmu data Python) untuk memandu Anda melalui menganalisis dan melakukan analisis prediktif pada dataset dunia nyata (mainan). Buku bagus lainnya untuk dikerjakan.
sumber
Perlu diingat bahwa sementara saya memiliki Magister Statistik Terapan, saya akan memberi Anda jawaban yang sangat sederhana: ambil kursus tentang probabilitas.
Sebagian besar kerangka kerja pemrograman ML modern mengambil sebagian besar matematika dari ilmu data; Anda benar-benar tidak membutuhkannya di sebagian besar skenario. Tetapi Anda akan selalu membutuhkan kemampuan untuk memahami hasil Anda dan sebagian besar hasil dinyatakan dalam probabilitas. Jika saya baru mengenal ilmu data, saya akan mengambil kursus (singkat) tentang probabilitas, berusaha memahami apa arti proporsi dan persentase sebenarnya dan kemudian saya akan bekerja untuk mengetahui kerangka kerja (seperti Tensorflow) dengan sangat, sangat baik. Jika Anda dapat melakukannya, Anda dapat menulis beberapa algoritma yang sangat menarik dan tidak harus terobsesi dengan matematika.
sumber