Saya sedang mengerjakan korpus teks kecil (200 juta), yang ingin saya jelajahi dengan beberapa analisis kluster. Buku atau artikel apa tentang hal itu yang akan Anda rekomendasikan?
Saya sedang mengerjakan korpus teks kecil (200 juta), yang ingin saya jelajahi dengan beberapa analisis kluster. Buku atau artikel apa tentang hal itu yang akan Anda rekomendasikan?
Mungkin layak untuk melihat buku-buku MW Berry:
Mereka terdiri dari serangkaian makalah yang diterapkan dan ditinjau. Yang terakhir sepertinya tersedia dalam bentuk PDF di alamat berikut: http://bit.ly/deNeiy .
Berikut adalah beberapa tautan yang terkait dengan CA sebagaimana diterapkan pada penambangan teks:
Anda juga dapat melihat Analisis Semantik Laten , tetapi lihat tanggapan saya di sana: Bekerja melalui masalah pengelompokan .
Menemukan Grup dalam Data. Pengantar Analisis Cluster dari profesor Leonard Kaufman dan Peter J. Rousseeuw.
Saya membaca buku dan menemukan itu sangat berguna karena:
Tujuan kami adalah untuk menulis buku terapan untuk pengguna umum. Kami ingin membuat analisis kluster tersedia untuk orang-orang yang belum tentu memiliki latar belakang matematika atau statistik yang kuat.
Ini memberikan konten teoretis untuk memahami fungsi-fungsi yang tersedia dalam R
paket Cluster .
Bab dapat dibaca secara individual sesuai dengan metode cluster yang menarik.
pengecualian adalah bab 3, yang dibangun di bab 2
Bab-bab buku ini adalah:
Referensi:
Kaufman, L., & Rousseeuw, PJ (2005). Menemukan Grup dalam Data. Pengantar Analisis Cluster (p. 342). John Wiley & Sons Inc.
Maechler, M. (2013). Analisis Cluster Extended Rousseeuw et al. CRAN.
Bab Pengantar Penambangan Data ini tersedia online dan memberikan tinjauan yang bagus.
sumber
Analisis Cluster oleh Brian S. Everitt adalah pengobatan panjang buku bagus diterapkan Analisis Cluster.
sumber
Tidak secara khusus tentang penambangan teks, tetapi saya cukup menyukai "Analisis Data Eksplorasi dengan MATLAB" oleh Martinez dan Martinez.
sumber
Buku mendalam lainnya yang layak dibaca: Buku Pegangan Analisis Cluster oleh Hennig et al. (2015)
sumber