Buku atau artikel yang direkomendasikan sebagai pengantar Analisis Cluster?

12

Saya sedang mengerjakan korpus teks kecil (200 juta), yang ingin saya jelajahi dengan beberapa analisis kluster. Buku atau artikel apa tentang hal itu yang akan Anda rekomendasikan?

miku
sumber

Jawaban:

6

Mungkin layak untuk melihat buku-buku MW Berry:

  1. Survei Text Mining I: Clustering, Classification, and Retrieval (2003)
  2. Survei Text Mining II: Clustering, Klasifikasi, dan Retrieval (2008)

Mereka terdiri dari serangkaian makalah yang diterapkan dan ditinjau. Yang terakhir sepertinya tersedia dalam bentuk PDF di alamat berikut: http://bit.ly/deNeiy .

Berikut adalah beberapa tautan yang terkait dengan CA sebagaimana diterapkan pada penambangan teks:

Anda juga dapat melihat Analisis Semantik Laten , tetapi lihat tanggapan saya di sana: Bekerja melalui masalah pengelompokan .

chl
sumber
5

Menemukan Grup dalam Data. Pengantar Analisis Cluster dari profesor Leonard Kaufman dan Peter J. Rousseeuw.

Saya membaca buku dan menemukan itu sangat berguna karena:

  • Seperti yang dinyatakan oleh penulis dalam kata pengantar:

Tujuan kami adalah untuk menulis buku terapan untuk pengguna umum. Kami ingin membuat analisis kluster tersedia untuk orang-orang yang belum tentu memiliki latar belakang matematika atau statistik yang kuat.

  • Ini memberikan konten teoretis untuk memahami fungsi-fungsi yang tersedia dalam Rpaket Cluster .

  • Bab dapat dibaca secara individual sesuai dengan metode cluster yang menarik.
    pengecualian adalah bab 3, yang dibangun di bab 2

Bab-bab buku ini adalah:

  1. pengantar
  2. Partisi Sekitar Medoids (Program PAM).
  3. Clustering Aplikasi Besar (Program CLARA).
  4. Analisis Fuzzy (Program LUCU).
  5. Nesting Agglomerative (Program AGNES).
  6. Analisis Divisive (Program DIANA).
  7. Analisis Monothetic (Program MONA).

Referensi:

Kaufman, L., & Rousseeuw, PJ (2005). Menemukan Grup dalam Data. Pengantar Analisis Cluster (p. 342). John Wiley & Sons Inc.

Maechler, M. (2013). Analisis Cluster Extended Rousseeuw et al. CRAN.

Andre Silva
sumber
Buku ini memang memberikan gambaran yang bagus tentang bidang ini. Ini berfokus pada beberapa algoritma / metode (misalnya siluet terkenal, yang kebetulan telah dirancang oleh salah satu penulis buku) dan mencakupnya secara luas. Itu juga dilengkapi dengan beberapa kode, tetapi gaya 1990. FYI: daftar isi lengkap .
Franck Dernoncourt
2

Analisis Cluster oleh Brian S. Everitt adalah pengobatan panjang buku bagus diterapkan Analisis Cluster.

Brett
sumber