Buku apa yang memberikan ikhtisar statistik komputasi yang berlaku untuk ilmu komputer?

15

Sebagai seorang insinyur perangkat lunak, saya tertarik pada topik-topik seperti algoritma statistik, penambangan data, pembelajaran mesin, jaringan Bayesian, algoritma klasifikasi, jaringan saraf, rantai Markov, metode Monte Carlo, dan pembangkitan angka acak.

Saya pribadi belum merasa senang bekerja langsung dengan salah satu teknik ini, tetapi saya harus bekerja dengan perangkat lunak yang, di bawah tenda, mempekerjakan mereka dan ingin tahu lebih banyak tentang mereka, pada tingkat tinggi. Saya mencari buku-buku yang mencakup luas - kedalaman tidak diperlukan pada saat ini. Saya pikir saya bisa belajar banyak tentang pengembangan perangkat lunak jika saya dapat memahami dasar matematika di balik algoritma dan teknik yang digunakan.

Dapatkah komunitas Analisis Statistik merekomendasikan buku yang dapat saya gunakan untuk mempelajari lebih lanjut tentang penerapan berbagai elemen statistik dalam perangkat lunak?

Thomas Owens
sumber

Jawaban:

3

Anda mungkin ingin membaca pertanyaan yang sangat populer tentang Stack Overflow tentang statistik apa yang harus diketahui oleh seorang programmer atau ilmuwan komputer .

Jeromy Anglim
sumber
Panggilan yang bagus. Saya menggunakan SO dan saya tidak menyadari bahwa ada pertanyaan. Adalah baik untuk memiliki tautan silang untuk saat-saat ketika pertanyaan mungkin muncul di beberapa bursa.
Thomas Owens
3

Berikut ini adalah buku yang sangat bagus dari James E. Gentle, Computational Statistics (Springer, 2009), yang mencakup aspek komputasi dan statistik dari analisis data. Lembut juga menulis buku-buku hebat lainnya, periksa publikasi nya.

Buku hebat lainnya adalah Handbook of Computational Statistics , dari Gentle et al. (Springer, 2004); itu beredar sebagai PDF di suatu tempat di web, jadi coba lihat di Google.

chl
sumber
2

Anda telah menyebutkan beberapa teknik ML, jadi dua buku yang cukup bagus (sayangnya karena favorit saya adalah dalam bahasa Polandia):
http://www.amazon.com/Machine-Learning-Algorithmic-Perspective-Recognition/dp/1420067184
http: / /ai.stanford.edu/~nilsson/mlbook.html

Untuk hal-hal numerik seperti pembuatan angka acak:
http://www.nr.com/

pengguna88
sumber
+1 buku Marsland cukup bagus dan mengisi celah besar dalam pemilihan buku ML yang ada.
ars
1

Saya mengambil salinan Probabilitas dan Statistik untuk Ilmuwan Komputer - Michael Baron dijual dengan buku statistik lain (saya jujur ​​membelinya karena namanya - saya ingin buku yang akan mengambil semacam melihat statistik dari perspektif ilmu komputer, bahkan jika itu tidak sempurna). Saya belum memiliki kesempatan untuk membacanya atau menyelesaikan masalah di dalamnya, tetapi sepertinya buku yang solid.

Kata pengantar buku ini mengatakan bahwa ini untuk mahasiswa tingkat atas dan mahasiswa pascasarjana, dan saya setuju dengan ini. Beberapa pemahaman tentang probabilitas dan statistik diperlukan untuk memahami isi buku ini.

Topik meliputi probabilitas, variabel acak diskrit, distribusi kontinu, metode Monte Carlo, proses stokastik, sistem antrian, inferensi statistik, dan regresi.

Thomas Owens
sumber
1

Meskipun ini bukan statistik komputasi khusus, Buku Pegangan Analisis Statistik Menggunakan R - Brian S. Everitt dan Torsten Hothorn mencakup banyak topik yang saya lihat dibahas dalam buku statistik dasar dan menengah - inferensi, ANOVA, regresi linier, regresi logistik, estimasi kepadatan, partisi rekursif, analisis komponen utama, dan analisis kluster - menggunakan bahasa R. Ini mungkin menarik bagi mereka yang tertarik dalam pemrograman.

Namun, tidak seperti buku-buku lain, penekanannya adalah pada penggunaan bahasa R untuk menjalankan fungsi statistik ini. Buku-buku lain yang saya lihat menggunakan kombinasi aljabar dan kalkulus untuk menunjukkan statistik. Buku ini sebenarnya berfokus pada bagaimana menganalisis data menggunakan bahasa R. Dan untuk membuatnya lebih berguna, set data yang digunakan penulis ada di CRAN - the R Repository.

Thomas Owens
sumber
1

Komputasi Statistik dengan R - Maria L. Rizzo mencakup banyak topik dalam Probabilitas dan Statistik untuk Ilmuwan Komputer - probabilitas dasar dan statistik, variabel acak, statistik Bayesian, rantai Markov, visualisasi data multivariat, metode Monte Carlo, tes Permutasi, probabilitas estimasi kerapatan, dan metode numerik.

Persamaan dan rumus yang digunakan disajikan baik sebagai rumus matematika maupun dalam kode R. Saya akan mengatakan bahwa pengetahuan dasar tentang probabilitas, statistik, kalkulus, dan mungkin matematika diskrit akan disarankan bagi siapa saja yang ingin membaca buku ini. Latar belakang pemrograman juga akan membantu, tetapi ada beberapa referensi untuk bahasa R, operator, dan sintaksis.

Thomas Owens
sumber
1

Sebagai seorang insinyur komputer yang datang untuk menganalisis data sendiri, sebuah buku yang benar-benar dapat dibaca yang mencakup hal-hal dari perspektif yang tidak dapat diintimidasi & mudah dibaca (dengan biaya tidak mencakup sebanyak buku-buku lain yang disarankan di sini) adalah Programming Collective Intelligence oleh Toby Segaran. Saya menemukan itu jauh lebih mudah didekati daripada, misalnya, buku Uskup, yang merupakan referensi bagus tetapi masuk lebih dalam yang mungkin Anda inginkan pada pass pertama. Di amazon: http://www.amazon.com/Programming-Collective-Intelligence-Building-Applications/dp/0596529325

pengguna1076
sumber
1

CRAN memiliki beberapa contoh buku yang bagus mengenai pemrograman statistik. Beberapa dari mereka tidak akan berkaitan dengan pembelajaran mesin dan MCMC, tetapi setiap entri diberi penjelasan, jadi Anda harus memiliki gagasan kasar tentang apa yang masing-masing buku isi untuk menyelam sedikit lebih jauh. http://www.r-project.org/doc/bib/R-books.html

Christopher Aden
sumber