Konteks
Saya ingin mengatur adegan sebelum sedikit memperluas pertanyaan.
Saya memiliki data longitudinal, pengukuran dilakukan pada subjek kira-kira setiap 3 bulan, hasil primer adalah numerik (seperti dalam kontinu hingga 1dp) dalam kisaran 5 hingga 14 dengan bulk (dari semua titik data) antara 7 dan 10. Jika saya melakukan plot spaghetti (dengan usia pada sumbu x dan garis untuk setiap orang) jelas berantakan karena saya memiliki> 1500 subjek, tetapi ada tapak yang jelas menuju nilai yang lebih tinggi dengan bertambahnya usia (dan ini diketahui).
Pertanyaan yang lebih luas: Apa yang ingin kita lakukan adalah pertama-tama dapat mengidentifikasi kelompok yang sedang tren (kelompok yang mulai tinggi dan tetap tinggi, yang mulai rendah dan tetap rendah, yang mulai rendah dan naik ke tinggi dll) dan kemudian kita bisa lihat faktor-faktor individual yang terkait dengan keanggotaan 'kelompok tren'.
Pertanyaan saya di sini secara khusus berkaitan dengan bagian pertama, pengelompokan berdasarkan tren.
Pertanyaan
- Bagaimana kita bisa mengelompokkan lintasan individual longitudinal?
- Perangkat lunak apa yang cocok untuk mengimplementasikan ini?
Saya telah melihat Proc Traj di SAS dan M-Plus yang disarankan oleh seorang kolega, yang saya cari, tetapi saya ingin tahu apa pendapat orang lain tentang hal ini.
sumber
kml
paket - yang tampaknya menyediakan fungsionalitas yang Anda butuhkan. Makalah dalam JoSS menjelaskannya secara rinci. Jugakml3d
&kmlShape
mungkin menarik.Jawaban:
Saya telah menggunakan Mfuzz dalam R untuk mengelompokkan set data microarray kursus-waktu. Mfuzz menggunakan "soft-clustering". Pada dasarnya, individu dapat muncul dalam lebih dari satu kelompok.
Seperti yang ditunjukkan oleh @Andy dalam komentar, makalah asli menggunakan data CTN. Namun, saya menduga bahwa itu harus bekerja OK untuk data diskrit Anda. Terutama karena Anda hanya menjelajahi kumpulan data. Berikut ini contoh cepat dalam R:
Berikan plot berikut:
sumber
Saya berharap ada paket MPLUS untuk melakukan apa yang Anda butuhkan. Ada sebuah makalah di Psychometrika tentang hampir tepatnya subjek ini
springerlink.com/content/25r110007g417187
kecuali datanya biner dan lintasannya adalah lintasan probabilitas. Para penulis menggunakan analisis kelas laten (diimplementasikan dengan menggunakan model campuran hingga dihukum) untuk mengelompokkan lintasan. Saya juga tahu penulis pertama menulis beberapa makalah lain sekitar 10 tahun yang lalu dengan Bengt Muthen (pencipta MPLUS) tentang analisis kelas laten dalam pengaturan yang sama (dengan lintasan). Sebagai contoh,
http://onlinelibrary.wiley.com/doi/10.1111/j.0006-341X.1999.00463.x/abstract
terdengar sangat mirip dengan apa yang Anda bicarakan, kecuali hasilnya adalah biner. Kasus kontinu jauh lebih sederhana, jadi saya akan melakukan pencarian literatur mundur (yaitu melihat makalah referensi makalah ini) untuk menemukan sesuatu yang cocok dengan apa yang telah Anda jelaskan lebih tepat.
Untuk mengetahui lebih lanjut, Anda dapat menanyakan langsung kepada pemilik MPLUS paket apa yang perlu Anda gunakan untuk melakukan apa yang Anda butuhkan. Mereka umumnya cukup cepat merespons dan sangat membantu:
http://www.statmodel.com/cgi-bin/discus/discus.cgi
sumber