Basis matematika untuk data mining dan algoritma kecerdasan buatan

12

Bisakah Anda memberi saya beberapa klarifikasi tentang data mining dan algoritma kecerdasan buatan? Basis matematika apa yang mereka gunakan? Bisakah Anda memberi saya titik awal, dalam matematika, untuk memahami jenis-jenis algoritma ini?

kjetil b halvorsen
sumber
Sebagai contoh, David Ferrucci, yang memimpin IBM DeepQA / Watson menang di Jeopardy, mengatakan ia ditakdirkan untuk menjadi sistem hybrid: tim yang terdiri dari 20-25 orang selama 4 tahun dari berbagai disiplin ilmu, termasuk NLP, linguistik komputasi, permainan teori, stokastik dan optimisasi dan disiplin lain bekerja di sana.
10 algoritma terbaik dalam penambangan data memberikan gambaran lembut tentang algoritma yang menginspirasi dan memimpin. Saya khawatir Anda harus memberikan rincian lebih lanjut (aplikasi apa? Tingkat detail apa?) Untuk mendapatkan jawaban yang bermanfaat.
chl

Jawaban:

5

Itu sebenarnya bisa terdengar sedikit aneh dalam komunitas ahli statistik, tetapi saya cukup yakin bahwa sebagian besar algoritma pembelajaran mesin dapat dirumuskan sebagai masalah minimisasi fungsional. Itu berarti bahwa ini akan ditutupi dengan optimasi matematis .

Hal lainnya adalah Anda mungkin perlu kalkulus dan aljabar linier untuk memahami apa itu optimasi. Dan untuk menginterpretasikan hasil Anda, Anda akan lebih memiliki latar belakang dalam teori probabilitas dan statistik .

Dmitry Laptev
sumber
Apakah ini murni komunitas ahli statistik, apakah ada situs pertukaran stack yang lebih baik untuk orang yang belajar mesin, saya tidak yakin ada yang berdedikasi?
image_doctor
1
Saya tidak tahu situs pertukaran stack pembelajaran mesin spesifik. Tetapi dalam hal ini Anda dapat menemukan banyak orang "belajar mesin" (misalnya saya), karena statistik dan pembelajaran mesin benar-benar sangat-sangat terhubung.
Dmitry Laptev
1

Pertanyaan ini mungkin luas, Anda harus mengatakan sesuatu tentang apa yang akan Anda gunakan untuk data mining! Tapi, data mining pada dasarnya adalah statistik, dan banyak dari penggunaan AI yang saya lihat adalah statistik juga. Jadi, matematika apa yang Anda butuhkan adalah matematika yang Anda perlukan untuk statistik: 1) kalkulus dan analisis nyata 2) probabilitas 3) Aljabar linier! Dalam istilah praktis, 3) mungkin yang paling penting, hampir apa pun yang akan Anda lakukan (termasuk penggunaan 1) dan 2)) Anda akan sangat bergantung pada aljabar linier. Jadi, pastikan untuk mendapatkan, tidak hanya konsep, tetapi juga keterampilan manipulatif!

Lebih banyak digunakan, tetapi mungkin lebih khusus. Jadi tidak masuk akal untuk memberikan saran yang lebih terperinci sampai Anda mengkhususkan pertanyaan Anda (dan belajar 1), 2) & 3))

kjetil b halvorsen
sumber
0

Sepertinya pertanyaan yang wajar, matematika apa yang harus saya pelajari sebagai dasar untuk pembelajaran mesin?
Mungkin jawabannya yang luas. Seperti ML menarik dari begitu banyak disiplin ilmu.

Lainnya menyarankan, Aljabar Linier, Teori Probabilitas, Statistik, Ruang Metrik dan banyak lainnya yang semuanya relevan.

Mungkin pendekatan yang bisa diterapkan adalah mendaftar beberapa algoritma ML paling populer dan lihatlah di dalamnya dan isi matematika yang menurut Anda kurang nyaman.

image_doctor
sumber