Sebagai seorang insinyur perangkat lunak, saya tertarik pada topik-topik seperti algoritma statistik, penambangan data, pembelajaran mesin, jaringan Bayesian, algoritma klasifikasi, jaringan saraf, rantai Markov, metode Monte Carlo, dan pembangkitan angka acak.
Saya pribadi belum merasa senang bekerja langsung dengan salah satu teknik ini, tetapi saya harus bekerja dengan perangkat lunak yang, di bawah tenda, mempekerjakan mereka dan ingin tahu lebih banyak tentang mereka, pada tingkat tinggi. Saya mencari buku-buku yang mencakup luas - kedalaman tidak diperlukan pada saat ini. Saya pikir saya bisa belajar banyak tentang pengembangan perangkat lunak jika saya dapat memahami dasar matematika di balik algoritma dan teknik yang digunakan.
Dapatkah komunitas Analisis Statistik merekomendasikan buku yang dapat saya gunakan untuk mempelajari lebih lanjut tentang penerapan berbagai elemen statistik dalam perangkat lunak?
sumber
Berikut ini adalah buku yang sangat bagus dari James E. Gentle, Computational Statistics (Springer, 2009), yang mencakup aspek komputasi dan statistik dari analisis data. Lembut juga menulis buku-buku hebat lainnya, periksa publikasi nya.
Buku hebat lainnya adalah Handbook of Computational Statistics , dari Gentle et al. (Springer, 2004); itu beredar sebagai PDF di suatu tempat di web, jadi coba lihat di Google.
sumber
Anda telah menyebutkan beberapa teknik ML, jadi dua buku yang cukup bagus (sayangnya karena favorit saya adalah dalam bahasa Polandia):
http://www.amazon.com/Machine-Learning-Algorithmic-Perspective-Recognition/dp/1420067184
http: / /ai.stanford.edu/~nilsson/mlbook.html
Untuk hal-hal numerik seperti pembuatan angka acak:
http://www.nr.com/
sumber
Saya mengambil salinan Probabilitas dan Statistik untuk Ilmuwan Komputer - Michael Baron dijual dengan buku statistik lain (saya jujur membelinya karena namanya - saya ingin buku yang akan mengambil semacam melihat statistik dari perspektif ilmu komputer, bahkan jika itu tidak sempurna). Saya belum memiliki kesempatan untuk membacanya atau menyelesaikan masalah di dalamnya, tetapi sepertinya buku yang solid.
Kata pengantar buku ini mengatakan bahwa ini untuk mahasiswa tingkat atas dan mahasiswa pascasarjana, dan saya setuju dengan ini. Beberapa pemahaman tentang probabilitas dan statistik diperlukan untuk memahami isi buku ini.
Topik meliputi probabilitas, variabel acak diskrit, distribusi kontinu, metode Monte Carlo, proses stokastik, sistem antrian, inferensi statistik, dan regresi.
sumber
Meskipun ini bukan statistik komputasi khusus, Buku Pegangan Analisis Statistik Menggunakan R - Brian S. Everitt dan Torsten Hothorn mencakup banyak topik yang saya lihat dibahas dalam buku statistik dasar dan menengah - inferensi, ANOVA, regresi linier, regresi logistik, estimasi kepadatan, partisi rekursif, analisis komponen utama, dan analisis kluster - menggunakan bahasa R. Ini mungkin menarik bagi mereka yang tertarik dalam pemrograman.
Namun, tidak seperti buku-buku lain, penekanannya adalah pada penggunaan bahasa R untuk menjalankan fungsi statistik ini. Buku-buku lain yang saya lihat menggunakan kombinasi aljabar dan kalkulus untuk menunjukkan statistik. Buku ini sebenarnya berfokus pada bagaimana menganalisis data menggunakan bahasa R. Dan untuk membuatnya lebih berguna, set data yang digunakan penulis ada di CRAN - the R Repository.
sumber
Komputasi Statistik dengan R - Maria L. Rizzo mencakup banyak topik dalam Probabilitas dan Statistik untuk Ilmuwan Komputer - probabilitas dasar dan statistik, variabel acak, statistik Bayesian, rantai Markov, visualisasi data multivariat, metode Monte Carlo, tes Permutasi, probabilitas estimasi kerapatan, dan metode numerik.
Persamaan dan rumus yang digunakan disajikan baik sebagai rumus matematika maupun dalam kode R. Saya akan mengatakan bahwa pengetahuan dasar tentang probabilitas, statistik, kalkulus, dan mungkin matematika diskrit akan disarankan bagi siapa saja yang ingin membaca buku ini. Latar belakang pemrograman juga akan membantu, tetapi ada beberapa referensi untuk bahasa R, operator, dan sintaksis.
sumber
Sebagai seorang insinyur komputer yang datang untuk menganalisis data sendiri, sebuah buku yang benar-benar dapat dibaca yang mencakup hal-hal dari perspektif yang tidak dapat diintimidasi & mudah dibaca (dengan biaya tidak mencakup sebanyak buku-buku lain yang disarankan di sini) adalah Programming Collective Intelligence oleh Toby Segaran. Saya menemukan itu jauh lebih mudah didekati daripada, misalnya, buku Uskup, yang merupakan referensi bagus tetapi masuk lebih dalam yang mungkin Anda inginkan pada pass pertama. Di amazon: http://www.amazon.com/Programming-Collective-Intelligence-Building-Applications/dp/0596529325
sumber
CRAN memiliki beberapa contoh buku yang bagus mengenai pemrograman statistik. Beberapa dari mereka tidak akan berkaitan dengan pembelajaran mesin dan MCMC, tetapi setiap entri diberi penjelasan, jadi Anda harus memiliki gagasan kasar tentang apa yang masing-masing buku isi untuk menyelam sedikit lebih jauh. http://www.r-project.org/doc/bib/R-books.html
sumber