Saya seorang pemula yang akan mulai membaca tentang penambangan data. Saya memiliki pengetahuan dasar tentang AI dan statistik. Karena banyak yang mengatakan bahwa pembelajaran mesin juga memainkan peran penting dalam penambangan data, apakah perlu membaca tentang pembelajaran mesin sebelum saya melanjutkan penambangan data?
14
Jawaban:
Menjadi agak dalam posisi ini sendiri, saya akan mencoba memberikan beberapa wawasan.
Pertama, unduh Elemen Pembelajaran Statistik . Ini mengandaikan kalkulus dan aljabar linier, dan meskipun sangat teknis, ia juga ditulis dengan sangat baik.
Kedua (atau pertama) lihat tutorial Andrew Ng tentang pembelajaran mesin.
Ketiga, dapatkan beberapa data, dan mulailah mencoba menganalisis data. Anda harus membagi menjadi beberapa set pelatihan dan tes, dan kemudian membangun model pada set pelatihan dan mengujinya terhadap set tes. Saya menemukan paket caret untuk R sangat berguna untuk semua ini. Setelah itu praktiknya, praktikkan latihan (seperti hampir semua yang lain).
sumber
Pengantar Penambangan Data oleh Tan, Steinbech, Kumar adalah buku intro terbaik di luar sana
http://www.amazon.com/Introduction-Data-Mining-Pang-Ning-Tan/dp/0321321367
hemat EoSL ketika Anda ingin menggali lebih dalam. Ini lebih dari referensi.
sumber
Penambangan data dapat bersifat deskriptif atau prediktif.
Di satu sisi, jika Anda tertarik dalam penambangan data deskriptif, maka pembelajaran mesin tidak akan membantu.
sumber
Saya hanya menambahkan sumber tutorial lain yang sangat bagus tentang penambangan data / pembelajaran mesin oleh Tom Mitchell .
Dia menjelaskan dengan sangat jelas dan Anda juga dapat mengunduh presentasinya dari situs webnya (bersama dengan menonton kuliahnya di sana).
sumber