Buku untuk dibaca sebelum Elemen Pembelajaran Statistik?

50

Berdasarkan posting ini , saya ingin mencerna Elemen Pembelajaran Statistik. Untungnya itu tersedia secara gratis dan saya mulai membacanya.

Saya tidak memiliki cukup pengetahuan untuk memahaminya. Bisakah Anda merekomendasikan buku yang merupakan pengantar yang lebih baik untuk topik dalam buku ini? Semoga sesuatu yang memberi saya pengetahuan yang dibutuhkan untuk memahaminya?

Terkait:

Apakah latar belakang yang kuat dalam matematika merupakan syarat mutlak untuk ML?

tidak diketahui
sumber
12
Saya menemukan Strang's Linear Algebra dan aplikasinya sangat berguna dalam memahami manipulasi matriks yang membentuk sebagian besar elemen.
richiemorrisroe

Jawaban:

18

Saya membeli, tetapi belum membaca,

S. Marsland, Pembelajaran Mesin: Perspektif Algoritma , Chapman & Hall, 2009.

Namun, ulasannya baik dan menyatakan bahwa itu lebih cocok untuk pemula daripada buku ML lainnya yang memiliki kedalaman lebih. Membalik-balik halaman, bagi saya itu baik bagi saya karena saya memiliki sedikit latar belakang matematika.

Steve P
sumber
Tampak hebat - sangat mudah diakses.
B Seven
Saya mengunduh dan membaca "sampel" - semua 19 halaman (wow). Jauh lebih mudah dipahami daripada Elemen Pembelajaran Statistik. Tampaknya apa yang saya cari. Terima kasih.
B Seven
4
Saya telah mengedit pertanyaan Anda untuk memberikan kutipan untuk buku ini. Secara umum, menempatkan hal-hal seperti "Saya suka yang ini " dalam sebuah jawaban tidak disarankan karena jika tautannya putus, tidak ada yang akan tahu apa yang dimaksud dengan "yang ini". Tepuk tangan.
kardinal
Saya baru saja mendapatkan ini dan mulai membacanya (75 halaman pertama). Itu luar biasa. Sangat mudah dimengerti, namun cukup detail sehingga praktis dan bermanfaat. Sangat direkomendasikan bagi siapa saja yang ingin menggunakan Machine Learning. Persis apa yang saya cari. Terima kasih!
B Seven
39

Para penulis Elemen Pembelajaran Statistik telah mengeluarkan buku baru (Agustus 2013) yang ditujukan untuk pengguna tanpa latar belakang matematika yang berat. Pengantar Pembelajaran Statistik: dengan Aplikasi dalam R

Versi PDF gratis dari buku ini saat ini dapat ditemukan di sini .

Brian
sumber
Saya akan menyarankan ini sejak rilis baru-baru ini dan jelas sangat terkait dengan teks obyektif poster. Rekomendasi bagus.
Chris Simokat
3
Lebih baik lagi, penulis telah mengumumkan bahwa pdf online gratis dari buku ini akan tersedia mulai Januari 2013 (sedang digunakan dalam MOOC yang sedang mereka jalankan.)
Flounderer
16

Saya menemukan Programming Collective Intelligence buku paling mudah untuk pemula, karena penulis Toby Segaran berfokus pada memungkinkan pengembang perangkat lunak median untuk mengotori tangannya dengan peretasan data secepat mungkin.

Bab umum: Masalah data dijelaskan dengan jelas, diikuti oleh penjelasan kasar bagaimana algoritma bekerja dan akhirnya menunjukkan cara membuat beberapa wawasan hanya dengan beberapa baris kode.

Penggunaan python memungkinkan seseorang untuk memahami segalanya lebih cepat (Anda tidak perlu tahu python, serius, saya tidak tahu sebelumnya, juga). JANGAN berpikir bahwa buku ini hanya berfokus pada pembuatan sistem rekomendasi. Ini juga berkaitan dengan penambangan teks / penyaringan spam / optimisasi / pengelompokan / validasi dll dan karenanya memberi Anda gambaran yang rapi atas alat dasar dari setiap penambang data.

Bab 10 bahkan membahas data pasar saham, tetapi fokusnya bukan pada penambangan data deret waktu. Mungkin satu-satunya kelemahan (untuk Anda) dari buku yang luar biasa ini.

steffen
sumber
Ini tersedia di Safari Books Online safaribooksonline.com . Terima kasih.
B Seven
1
Dapatkan buku ini dan mulai mengerjakannya. Ini sangat praktis. Di 18 halaman pertama Anda menerapkan mesin rekomendasi (dasar) yang lengkap.
B Seven
Wow, buku ini benar-benar luar biasa. Ini mengajarkan Anda bagaimana menerapkan semua jenis algoritma Machine Learning hanya dengan sedikit kode Python. Salah satu buku paling praktis yang pernah ada. Satu-satunya kelemahan adalah bahwa Python telah diperbarui sejak buku itu diterbitkan. Ini juga menggunakan banyak API yang juga telah berubah. Jadi saya tidak berpikir contohnya akan bekerja tanpa tweaker.
B Seven
@BBahkan terima kasih, tidak tahu itu. Saya tidak yakin apakah saya lebih suka buku yang menggunakan perpustakaan yang sudah ada sebelumnya (yang umumnya merupakan hal yang bisa) atau kode sendiri (yang bekerja untuk semua contoh buku tetapi mungkin kurang kuat karena lebih sedikit pengguna).
steffen
1
Saya pikir hari ini satu-satunya pilihan adalah perpustakaan yang sudah ada. Mereka ada di mana-mana, mudah diintegrasikan, lintas platform, multi-bahasa, dan cepat. Selain itu, jika sebuah buku memiliki kode sendiri, itu jauh lebih sulit untuk dimodifikasi. Lebih mudah untuk memodifikasi panggilan ke perpustakaan. Terima kasih untuk rekomendasinya. Ini adalah sumber yang bagus.
B Seven
13

Pengantar Machine Learning , oleh E. Alpaydin (MIT Press, 2010, 2nd ed.), Mencakup banyak topik dengan ilustrasi yang bagus (seperti Bishop's Pattern Recognition dan Machine Learning ).

Selain itu, Andrew W. Moore memiliki beberapa tutorial yang bagus tentang Statistik Data Mining .

chl
sumber
(+1) Tidak tahu buku itu, tetapi tutorial dari Andrew Moore sangat bagus (dan kadang-kadang bahkan menghibur)
steffen
@steffen Saya akan merekomendasikan Metode Statistik Radford Neale untuk Pembelajaran Mesin dan Penambangan Data juga.
chl
1
+1 Alpaydin adalah cara yang tepat untuk digunakan. Saya berada dalam situasi yang sama persis dengan OP beberapa bulan yang lalu. Berjuang buruk dengan Tibshirani, dan kemudian bertemu Alpaydin dan segalanya menjadi lebih baik sejak itu. Akhirnya meskipun saya pikir Tibshirani adalah suatu keharusan dibaca.
Andy
10

Mayhaps Semua Statistik Wasserman akan menarik. Anda dapat mengambil sampel buku dari tautan yang diberikan - dan hanya beberapa paragraf pertama dari kata pengantar yang membuat penjualan sulit ke pasar Anda - dan Anda mungkin dapat mengunduh buku secara gratis melalui Springer jika Anda terkait dengan universitas.

EDIT: Ups, tidak memperhatikan seberapa kuno utas ini.

orang
sumber
5
Tidak masalah, rekomendasinya masih berguna untuk semua orang yang membaca utas (seperti saya; o).
Dikran Marsupial
1
Buku yang bagus, tetapi dalam keadilan, jika seseorang dapat membaca dan memahami Semua Statistik , sebagian besar ESL berlebihan.
usεr11852 mengatakan Reinstate Monic
7

Elemen Pembelajaran Statistik mungkin merupakan bacaan yang sulit, terutama untuk pembelajar mandiri. Saat mencari beberapa penjelasan pada bab kedua saya menemukan sumber berikut: https://waxworksmath.com/Authors/G_M/Hastie/WriteUp/Weatherwax_Epstein_Hastie_Solution_Manual.pdf . Ini berisi 100 halaman penjelasan dan penjelasan yang menjelaskan beberapa momen rumit dari buku ini. Sumber yang bagus untuk semua orang yang membaca buku ini. Teks pelengkap ini mencakup solusi untuk latihan.

Kirill Dubovikov
sumber
5

Saya sangat merekomendasikan Kursus Pertama dalam Pembelajaran Mesin oleh Rogers dan Girolami. Ini mencakup ide-ide kunci dalam urutan yang sangat logis, dengan contoh-contoh yang baik dan dengan tingkat matematika minimum untuk memiliki landasan yang tepat dalam fundamental. Itu tidak memiliki cakupan luas dari beberapa buku, tapi itulah sebabnya itu sangat bagus sebagai teks pengantar.

Dikran Marsupial
sumber
Sepertinya buku pertama yang bagus. Dan, ada versi Kindle.
B Seven
3

Buku lain yang sangat menarik adalah Bayesian Reasoning and Machine Learning karya David Barber. Buku ini tersedia sebagai unduhan gratis dari situs web penulis: http://www.cs.ucl.ac.uk/staff/d.barber/brml/

pengguna111093
sumber