Mesin belajar buku masak / kartu referensi / cheatsheet?

57

Saya menemukan sumber daya seperti Buku Catatan Probabilitas dan Statistik dan Kartu Referensi R untuk Penambangan Data yang sangat berguna. Mereka jelas berfungsi dengan baik sebagai referensi tetapi juga membantu saya untuk mengatur pikiran saya pada suatu subjek dan mendapatkan awam dari tanah.

T: Apakah ada sumber daya seperti ini yang ada untuk metode pembelajaran mesin?

Saya membayangkan kartu referensi yang untuk setiap metode ML akan mencakup:

  • Properti Umum
  • Ketika metode ini bekerja dengan baik
  • Ketika metode ini buruk
  • Dari mana atau ke metode lain metode mana digeneralisasikan. Apakah sebagian besar telah digantikan?
  • Makalah seminal tentang metode ini
  • Buka masalah yang terkait dengan metode ini
  • Intensitas komputasi

Semua hal ini dapat ditemukan dengan sedikit menggali melalui buku teks saya yakin. Akan sangat mudah untuk memilikinya di beberapa halaman.

rendah
sumber
5
Tujuan yang bagus, tetapi "minimal menggali beberapa buku teks"? Bagaimana seseorang dapat mulai mengkompres mengatakan 20 Buku ini untuk pembelajaran statistik dan penggalian data + mloss.org/software/rating ?
denis
2
(+1) untuk chuzpa, jika ikhtisar seperti itu ada, saya akan membayarnya. Masalah utama adalah bahwa di samping beberapa properti yang dapat diturunkan dari algoritma itu sendiri, sebagian besar properti atau aturan praktis diperoleh dengan pengalaman, yaitu aplikasi. Saya cukup yakin seorang peneliti terapan yang diperkeras-pertempuran atau ML-framework-programmer / konsultan dapat menulis sesuatu seperti itu ... tetapi di sini dan sekarang?
steffen
@Denis: tautan "20 buku .." tidak berfungsi, dapatkah Anda memeriksanya?
lmsasu
6
Saya bukan ahli pembelajaran mesin, jadi saya akan menundukkan orang lain untuk mengirim jawaban, tetapi saya pikir Elemen Pembelajaran Statistik dianggap sebagai teks yang bagus untuk subjek tersebut dan ditulis oleh beberapa nama besar di bidang ini. Saya harus menambahkan bahwa buku ini ditulis pada tingkat tinggi dan yang saya dengar merekomendasikannya memang memiliki gelar PhD dalam statistik.
Makro

Jawaban:

25

Beberapa sumber daya terbaik dan tersedia secara bebas adalah:

Mengenai pertanyaan penulis, saya belum menemukan solusi "Semua dalam satu halaman"

Sergey
sumber
Sergey, apakah buku Barber terkait dengan Matlab?
denis
2
Ya, Coba lihat tautan buku ini: Kotak BRMLtool disediakan untuk membantu pembaca melihat bagaimana model matematika diterjemahkan ke dalam kode MAT-LAB yang sebenarnya.
Sergey
31

Jika Anda ingin belajar Pembelajaran Mesin, saya sangat menyarankan Anda mendaftar di kursus ML online gratis di musim dingin yang diajarkan oleh Prof. Andrew Ng .

Saya melakukan yang sebelumnya di musim gugur dan semua materi pembelajaran memiliki kualitas luar biasa dan diarahkan untuk aplikasi praktis, dan jauh lebih mudah untuk mendapatkan yang berjuang sendirian dengan buku.

Ini juga membuat buah gantung yang cukup rendah dengan penjelasan intuitif yang bagus dan jumlah minimum matematika.

clyfe
sumber
Saya baru saja menyelesaikan kursus ini dan itu luar biasa! Juga, itu memberi saya awal yang bagus untuk memahami buku tentang pembelajaran mesin.
B Seven
1
Saya pikir tautan ini sekarang adalah coursera.org/course/ml
n611x007
14

Ya, Anda baik-baik saja; "Pengenalan Pola dan Pembelajaran Mesin" dari Christopher Bishop adalah buku yang bagus untuk referensi umum, Anda tidak bisa salah dengan itu.

Buku yang cukup baru tetapi juga ditulis dengan sangat baik dan sama-sama luas adalah karya David Barber " Bayesian Reasoning and Machine Learning "; buku yang saya rasa sedikit lebih cocok untuk pendatang baru di lapangan.

Saya telah menggunakan "Elemen Pembelajaran Statistik" dari Hastie et al. (disebutkan oleh Makro) dan meskipun buku yang sangat kuat saya tidak akan merekomendasikannya sebagai referensi pertama; mungkin itu akan membantu Anda lebih baik sebagai referensi kedua untuk topik yang lebih khusus. Dalam aspek itu, buku David MacKay, Teori Informasi, Inferensi, dan Algoritma Pembelajaran , juga dapat melakukan pekerjaan yang sangat bagus.

usεr11852 kata Reinstate Monic
sumber
2
+1 untuk Bishop. Pengembangan yang jelas dengan tingkat detail yang merata. Sementara masih bagus, saya selalu menemukan Hastie et al. sedikit berombak.
conjugateprior
1
+1 - Hastie, Tibshirani, dan Friedman adalah favorit pribadi saya.
Tugas
1
+1 juga karena merekomendasikan Hastie, Tibshirani, dan Friedman, favorit pribadi saya juga. Dan terima kasih atas rekomendasi lainnya; Saya akan memberi mereka bacaan karena saya benar-benar membutuhkan buku yang bagus untuk merekomendasikan kepada yang bukan ahli statistik (atau orang yang baru saja memasuki bidang ini).
Néstor
1
+1 untuk Bishop. Ini sebenarnya sumber yang bagus untuk statistik klasik juga, tetapi diperbarui dan tersamar.
dugaan
10

Karena tampaknya konsensus bahwa pertanyaan ini bukan duplikat, saya ingin membagikan favorit saya untuk pemula yang belajar mesin:

Saya menemukan Programming Collective Intelligence buku paling mudah untuk pemula, karena penulis Toby Segaran berfokus pada memungkinkan pengembang perangkat lunak median untuk mengotori tangannya dengan peretasan data secepat mungkin.

Bab umum: Masalah data dijelaskan dengan jelas, diikuti oleh penjelasan kasar bagaimana algoritma bekerja dan akhirnya menunjukkan cara membuat beberapa wawasan hanya dengan beberapa baris kode.

Penggunaan python memungkinkan seseorang untuk memahami segalanya lebih cepat (Anda tidak perlu tahu python, serius, saya tidak tahu sebelumnya, juga). JANGAN berpikir bahwa buku ini hanya berfokus pada pembuatan sistem rekomendasi. Ini juga berkaitan dengan penambangan teks / penyaringan spam / optimisasi / pengelompokan / validasi dll dan karenanya memberi Anda tinjauan yang rapi atas alat dasar dari setiap penambang data.

steffen
sumber
6

Witten dan Frank, "Data Mining", Elsevier 2005 adalah buku yang bagus untuk belajar mandiri karena ada perpustakaan kode Java (Weka) untuk disertakan dengan buku itu dan sangat praktis berorientasi. Saya menduga ada edisi yang lebih baru daripada yang saya miliki.

Dikran Marsupial
sumber
1
Ya, buku ini dinamai "Pembelajaran Mesin" tetapi namanya diubah menjadi "Data Mining" oleh penerbit untuk mengendarai hype data mining pada saat itu, namun buku ini tentang ML bukan DM (dua kesamaan sederhana, tetapi bidang yang berbeda!).
clyfe
1
Buku Tom Mitchell "Machine Learning" juga sangat bagus; gaya agak kuno, tetapi kontennya sangat baik.
Dikran Marsupial
Ya, ML Tom Mitchell seperti alkitab ML, benar-benar komprehensif di lapangan!
clyfe
5

"Elemen Pembelajaran Statistik" akan menjadi buku yang bagus untuk tujuan Anda. Edisi ke-5 buku ini, yang diterbitkan pada awal 2011, tersedia secara bebas di http://www.stanford.edu/~hastie/local.ftp/Springer/ESLII_print5.pdf

DanB
sumber
2
ini adalah buku yang berat matematika karena itu mungkin sulit bagi pelajar mandiri untuk mengikuti.
Atilla Ozgur
Apakah Anda tahu bagaimana hal itu dapat diunduh secara bebas di halaman pribadi Trevor Hastie ketika Springer mengenakan biaya $ 70 untuk itu?
Alfred M.
Saya tidak tahu pasti, tetapi saya akan membayangkan Springer menginginkan uang, dan penulis terutama ingin mempublikasikan buku mereka secara luas. Ini kelihatannya sangat mirip dengan bagaimana Springer akan menjual artikel yang telah Anda publikasikan sementara banyak "versi kertas kerja" tersedia secara bebas di situs web penulis.
DanB
FYI, unduhan untuk pencetakan ke-5 edisi kedua. Saya suka catatan kaki ke eipgraph "Dalam Tuhan kami percaya, semua orang lain membawa data" yang dikaitkan dengan Deming. Catatan kaki menunjukkan ironi bahwa tidak ada "data" dapat ditemukan mengkonfirmasikan Deming benar-benar mengatakan ini.
HeatfanJohn
Anda harus menyebutkan Pengantar Pembelajaran Statistik dengan R - itu seperti ESL -lite mereka (jika matematika dalam ESL terlalu menakutkan).
Steve S
5

masukkan deskripsi gambar di sini

Seringkali bagian tersulit dalam menyelesaikan masalah pembelajaran mesin adalah menemukan penaksir yang tepat untuk pekerjaan itu. Penduga yang berbeda lebih cocok untuk berbagai jenis data dan masalah yang berbeda. Diagram alir di bawah ini dirancang untuk memberi pengguna sedikit panduan kasar tentang cara mendekati masalah terkait dengan estimator mana yang akan dicoba pada data Anda. Klik pada penaksir mana saja pada bagan di bawah ini untuk melihat dokumentasinya.

Anton Tarasenko
sumber
3

Sebagian besar buku yang disebutkan dalam jawaban lain sangat bagus dan Anda tidak bisa salah dengan salah satu dari mereka. Selain itu, saya menemukan lembar contekan untuk Python scikit-learncukup berguna.

Marc Claesen
sumber
2

Saya suka Duda, Hart dan Bangau "Klasifikasi Pola". Ini adalah revisi terbaru dari teks klasik yang menjelaskan semuanya dengan sangat baik. Tidak yakin bahwa itu diperbarui untuk memiliki banyak jangkauan jaringan saraf dan SVM. Buku karya Hastie, Tibshirani dan Friedman adalah tentang yang terbaik yang ada tetapi mungkin sedikit lebih teknis daripada apa yang Anda cari dan lebih rinci daripada tinjauan umum tentang subjek.

Michael Chernick
sumber
2

Microsoft Azure juga menyediakan cheat-sheet yang mirip dengan scikit-learning yang diposting oleh Anton Tarasenko.

Lembar Cheat Algoritma Pembelajaran Mesin Azure Microsoft

(sumber: https://docs.microsoft.com/en-us/azure/machine-learning/machine-learning-algorithm-cheat-sheet )

Mereka menemani dengan pemberitahuan:

Saran yang ditawarkan dalam lembar contekan algoritma ini adalah perkiraan aturan praktis. Beberapa dapat dibengkokkan, dan beberapa dapat secara terang-terangan dilanggar. Ini dimaksudkan untuk menyarankan titik awal. (...)

Microsoft juga menyediakan artikel pengantar yang memberikan rincian lebih lanjut.

Harap perhatikan bahwa materi tersebut difokuskan pada metode yang diterapkan di Microsoft Azure.

Tim
sumber
1

Jangan mulai dengan Elemen Pembelajaran Statistik. Sangat bagus, tetapi buku referensi, yang kedengarannya tidak seperti yang Anda cari. Saya akan mulai dengan Programming Collective Intelligence karena mudah dibaca.

Neil McGuigan
sumber
Saya tidak yakin saya akan mencirikan ESL sebagai teks referensi. Tampaknya lebih merupakan gambaran bagi saya, yaitu, Anda tidak akan mempelajari rincian sepele tentang (hampir) apa pun. Anda akan melihat teknik luas dan tema menyeluruh.
kardinal
1

Untuk buku pertama tentang pembelajaran mesin, yang melakukan pekerjaan dengan baik dalam menjelaskan prinsip-prinsip, saya akan sangat merekomendasikan

Rogers dan Girolami, Kursus Pertama dalam Pembelajaran Mesin , (Chapman & Hall / Pembelajaran Mesin CRC & Pengenalan Pola), 2011.

Buku Chris Bishop, atau David Barber, keduanya membuat pilihan yang baik untuk sebuah buku dengan luas yang lebih besar, begitu Anda memahami prinsip-prinsipnya.

Dikran Marsupial
sumber
0

Saya menulis ringkasan seperti itu, tetapi hanya pada satu tugas pembelajaran mesin (Hadiah Netflix), dan memiliki 195 halaman: http://arek-paterek.com/book

Arek Paterek
sumber
0

Cheatsheet yang baik adalah yang ada di buku Max Kuhn Applied Predictive Modeling . Dalam buku itu ada tabel ringkasan yang bagus dari beberapa model pembelajaran ML. Tabelnya ada dalam lampiran A halaman 549.

PolBM
sumber