Saya memiliki data yang mewakili beberapa aspek perilaku manusia. Saya ingin mengelompokkannya (tanpa pengawasan) ke dalam beberapa profil perilaku. sekarang, beberapa variabel saya adalah kategorikal (dengan 2 kategori atau lebih), dan ada pula yang kontinu (sebagian besar adalah persentase). Beberapa variabel bahkan lebih kompleks karena satu kategori memiliki kontinu lebih lanjut dan yang lainnya tidak memiliki data tambahan tersebut.
Pertanyaan saya adalah bagaimana cara mengategorikan data ini. Apa pendekatan (umum?) Yang berurusan dengannya?
Saya tidak memerlukan kode atau apa pun, melainkan beberapa referensi atau arahan yang akan membantu saya lebih memahami bagaimana menghadapi tantangan ini.
Jika Anda tahu R
fungsi yang memfasilitasi analisis seperti itu, itu akan bagus, tetapi itu tidak perlu.
Terima kasih.
Jawaban:
sumber
Lihat https://cran.r-project.org/web/packages/ClustOfVar untuk paket R
ClustOfVar
. Tampaknya menerapkan beberapa metode pengelompokan terbaik yang tersedia untuk campuran tipe variabel.sumber