Analisis Cluster diikuti oleh Analisis Diskriminan

10

Apa alasannya, jika ada, untuk menggunakan Analisis Diskriminan (DA) pada hasil algoritma pengelompokan seperti k-means, seperti yang saya lihat dari waktu ke waktu dalam literatur (pada dasarnya pada subtyping klinis gangguan mental)?

Umumnya tidak direkomendasikan untuk menguji perbedaan kelompok pada variabel yang digunakan selama konstruksi cluster karena mereka mendukung maksimalisasi (minimalisasi resp) dari inersia antar-kelas (resp. Dalam-kelas). Jadi, saya tidak yakin untuk sepenuhnya menghargai nilai tambah DA prediktif, kecuali kita berusaha untuk menanamkan individu dalam ruang faktorial dengan dimensi yang lebih rendah dan mendapatkan gagasan tentang "generalisasi" dari partisi semacam itu. Tetapi bahkan dalam kasus ini, analisis cluster tetap secara fundamental merupakan alat eksplorasi, sehingga menggunakan keanggotaan kelas yang dikomputasi dengan cara ini untuk mendapatkan aturan penilaian lebih lanjut tampak aneh pada pandangan pertama.

Adakah rekomendasi, ide, atau petunjuk ke makalah yang relevan?

chl
sumber
Berikut ini penjelasan dan contoh menggunakan R: cran.r-project.org/web/packages/adegenet/vignettes/…
Ben

Jawaban:

5

Saya tidak tahu ada makalah tentang ini. Saya telah menggunakan pendekatan ini, untuk tujuan deskriptif. DFA menyediakan cara yang bagus untuk meringkas perbedaan dan dimensi kelompok sehubungan dengan variabel asli. Satu mungkin lebih mudah hanya profil grup pada variabel asli, namun, ini kehilangan sifat multivariat yang inheren dari masalah pengelompokan. DFA memungkinkan Anda untuk menggambarkan grup sambil menjaga karakter multivarian dari masalah tetap ada. Jadi, dapat membantu dengan interpretasi cluster, di mana itu adalah tujuan. Ini sangat ideal ketika ada hubungan erat antara metode pengelompokan Anda dan metode klasifikasi Anda - misalnya, metode DFA dan Ward.

Anda benar tentang masalah pengujian. Saya menerbitkan sebuah makalah menggunakan Analisis Cluster dengan tindak lanjut DFA untuk menggambarkan solusi clustering. Saya mempresentasikan hasil DFA tanpa statistik uji. Peninjau mengambil masalah dengan itu. Saya mengakui dan meletakkan statistik uji dan nilai p di sana, dengan penafian bahwa nilai-p ini tidak boleh ditafsirkan secara tradisional.

Brett
sumber
Apa yang akan menjadi langkah prosedural DA setelah pengelompokan? Bisakah Anda memikirkan teknik lain untuk mengetahui variabel asli apa yang membuat kluster tertentu berbeda dari yang lain?
danas.zuokas
Mau berbagi rujukan ke makalah itu, Brett?
Roman Luštrik
Weissman & Magill. 2008. "Mengembangkan Tipologi Siswa untuk Meneliti Efektivitas Seminar Tahun Pertama" Jurnal Pengalaman Tahun Pertama & Siswa dalam Transisi 20 (2). Hubungi saya luring jika Anda ingin cetak.
Brett