Saya memiliki banyak variabel yang berisi data longitudinal dari hari 0 hingga hari 7. Saya mencari pendekatan pengelompokan yang sesuai yang dapat mengelompokkan variabel-variabel longitudinal ini (bukan kasus) ke dalam kelompok yang berbeda. Saya mencoba menganalisis kumpulan data ini secara terpisah berdasarkan waktu, tetapi hasilnya cukup sulit untuk dijelaskan secara wajar.
Saya menyelidiki ketersediaan prosedur SAS PROC SIMILARITY
karena ada contoh di situs webnya ; Namun, saya pikir itu bukan cara yang benar. Beberapa penelitian sebelumnya menggunakan analisis faktor eksplorasi di setiap titik waktu, tetapi ini bukan pilihan dalam penelitian saya juga karena hasil yang tidak masuk akal.
Semoga beberapa ide dapat diberikan di sini, dan program yang dikompilasi, seperti SAS atau R, dapat tersedia untuk diproses. Setiap saran sangat dihargai !!
Ini adalah contoh singkat (maaf untuk posisi yang tidak konsisten antara data dan nama variabel):
id time V1 V2 V3 V4 V5 V6 V7 V8 V9 V10
2 0 8 7 3 7 6 6 0 0 5 2
2 1 3 5 2 6 5 5 1 1 4 2
2 2 2 3 2 4 4 2 0 0 2 2
2 3 6 4 2 5 3 2 1 2 3 3
2 4 5 3 4 4 3 3 4 3 3 3
2 5 6 4 5 5 6 3 3 2 2 2
2 6 7 5 2 4 4 3 3 4 4 5
2 7 7 7 2 6 4 4 0 0 4 3
4 0 10 7 0 2 2 6 7 7 0 9
4 1 8 7 0 0 0 9 3 3 7 8
4 2 8 7 0 0 0 9 3 3 7 8
4 3 8 7 0 0 0 9 3 3 7 8
4 4 5 7 0 0 0 9 3 3 7 8
4 5 5 7 0 0 0 9 3 3 7 8
4 6 5 7 0 0 0 9 3 3 7 8
4 7 5 7 0 0 0 9 3 3 7 8
5 0 9 6 1 3 2 2 2 3 3 5
5 1 7 3 1 3 1 3 2 2 1 3
5 2 6 4 0 4 2 4 2 1 2 4
5 3 6 3 2 3 2 3 3 1 3 4
5 4 8 6 0 5 3 3 2 2 3 4
5 5 9 6 0 4 3 3 2 3 2 5
5 6 8 6 0 4 3 3 2 3 2 5
5 7 8 6 0 4 3 3 2 3 2 5
sumber
Jawaban:
Dalam
Hmisc
paket R, lihat file bantuan untukcurveRep
fungsi, yang merupakan singkatan dari "kurva representatif."curveRep
klaster pada bentuk kurva, lokasi, dan pola titik waktu yang hilang.sumber
x[id==i] <- if(i %% 2) runif(nc[i]) else runif(nc[i], c(.25, .75))
Saya tidak yakin itu yang Anda cari, tetapi paket
kml
di R menggunakan k-means untuk mengelompokkan urutan tindakan berulang. Berikut adalah tautan ke halaman paket dan ke kertas (sayangnya, itu terjaga keamanannya). Ini hanya berfungsi dengan baik jika Anda memiliki dataset yang cukup kecil (beberapa ratus urutan).di sini adalah versi non-gated dari makalah (tanpa masalah referensi): http://christophe.genolini.free.fr/recherche/aTelecharger/genolini2011.pdf
sumber
Jadi, Anda memiliki hal variabel diukur setiap t kali pada n individu yang sama . Salah satu cara untuk melanjutkan adalah menghitung t pXp (dis) matriks kesamaan dan menerapkan Multidimentional Scaling model INDSCAL. Ini akan memberi Anda dua peta dimensi rendah (katakanlah, 2 dimensi). Peta pertama menunjukkan koordinat dari p variabel dalam ruang dimensi dan mencerminkan pengelompokan di antara mereka, jika ada. Peta kedua menunjukkan bobot (yaitu kepentingan, atau arti-penting) dari dimensi dalam setiap matriks t .
sumber