Bagaimana cara mulai membaca tentang penambangan data?

14

Saya seorang pemula yang akan mulai membaca tentang penambangan data. Saya memiliki pengetahuan dasar tentang AI dan statistik. Karena banyak yang mengatakan bahwa pembelajaran mesin juga memainkan peran penting dalam penambangan data, apakah perlu membaca tentang pembelajaran mesin sebelum saya melanjutkan penambangan data?

Semut
sumber
1
Penambangan Data: Konsep dan Teknik Oleh Jiawei Han adalah awal yang baik
aaronjg

Jawaban:

12

Menjadi agak dalam posisi ini sendiri, saya akan mencoba memberikan beberapa wawasan.

Pertama, unduh Elemen Pembelajaran Statistik . Ini mengandaikan kalkulus dan aljabar linier, dan meskipun sangat teknis, ia juga ditulis dengan sangat baik.

Kedua (atau pertama) lihat tutorial Andrew Ng tentang pembelajaran mesin.

Ketiga, dapatkan beberapa data, dan mulailah mencoba menganalisis data. Anda harus membagi menjadi beberapa set pelatihan dan tes, dan kemudian membangun model pada set pelatihan dan mengujinya terhadap set tes. Saya menemukan paket caret untuk R sangat berguna untuk semua ini. Setelah itu praktiknya, praktikkan latihan (seperti hampir semua yang lain).

richiemorrisroe
sumber
1
Anda akan menakuti orang miskin itu selamanya!
Neil McGuigan
Kursus Andew Ng akan 'ditawarkan gratis dan online' ke seluruh dunia siswa selama musim gugur 2011 menurut ml-class.org
Andre Holzner
4

Penambangan data dapat bersifat deskriptif atau prediktif.

Di satu sisi, jika Anda tertarik dalam penambangan data deskriptif, maka pembelajaran mesin tidak akan membantu.

kn

  • kn
  • knn
Wok
sumber
3
Perlu dicatat bahwa beberapa penulis suka membuat perbedaan antara DM dan ML tergantung pada besarnya k/n. Saya pribadi menyukai pendekatan Radford Neale, dalam studinya tentang Metode Statistik untuk Pembelajaran Mesin dan Penambangan Data : Banyak masalah pembelajaran mesin memiliki sejumlah besar variabel, aplikasi penambangan data sering melibatkan banyak kasus.
chl
3

Saya hanya menambahkan sumber tutorial lain yang sangat bagus tentang penambangan data / pembelajaran mesin oleh Tom Mitchell .

Dia menjelaskan dengan sangat jelas dan Anda juga dapat mengunduh presentasinya dari situs webnya (bersama dengan menonton kuliahnya di sana).

Miroslav Sabo
sumber