teknik pembelajaran mesin untuk data longitudinal

11

Saya bertanya-tanya apakah ada teknik pembelajaran mesin (tanpa pengawasan) untuk memodelkan data longitudinal? Saya selalu menggunakan model efek campuran (kebanyakan non-linear) tapi saya bertanya-tanya apakah ada cara lain untuk melakukan ini (menggunakan pembelajaran mesin).

Dengan pembelajaran mesin, maksud saya hutan acak, klasifikasi / pengelompokan, pohon keputusan dan bahkan pembelajaran yang mendalam, dll.

John_dydx
sumber
Bisakah Anda mendefinisikan apa yang Anda maksud dengan "pembelajaran mesin"? Anda dapat meningkatkan LME setelah stratifikasi yang sesuai. Itu sebenarnya novel yang sangat bagus!
usεr11852
@ usεr11852, saya telah menambahkan sedikit penjelasan untuk pertanyaan ini - semoga ini menjelaskan lebih banyak.
John_dydx
Ah ... jadi meningkatkan bukan ML sesuai dengan definisi Anda. Cool Terima kasih atas klarifikasi semoga akan segera mendapat perhatian.
usεr11852
... dan meningkatkan juga.
John_dydx
3
Pertanyaan ini nampak tidak jelas. "Pembelajaran mesin" adalah istilah yang luas, dan bahkan kategori "hutan acak, klasifikasi / pengelompokan, pohon keputusan dan bahkan pembelajaran yang mendalam, dll." cukup luas. Apakah ada aplikasi jelas yang Anda minati? Jika, misalnya, Anda perlu mengklasifikasikan output dikotomis, Anda dapat menggunakan model efek campuran logistik atau GEE logistik. Model pembelajaran dan model statistik tidak harus berbeda.
Jon

Jawaban:

7

Dalam kasus di mana terdapat beberapa pengamatan dari satu subjek (misalnya, kunjungan berulang dari pasien yang sama), maka 'id pasien' adalah variabel 'pengelompokan'. Perawatan harus diambil selama evaluasi model sehingga kunjungan dari pasien yang sama tidak muncul dalam pelatihan dan data pengujian, karena ini berkorelasi dan akan menyebabkan inflasi akurasi klasifikasi .

The dokumentasi cross-validasi sklearn memiliki iterator cross-validasi untuk data dikelompokkan. Lihat GroupKFold , LeaveOneGroupOut , dan LeavePGroupsOut .

Bahkan lebih baik, coba Recurrent Neural Networks atau Hidden Markov Models .

pengguna0
sumber
4

Anda dapat memodelkan longitudinal Anda dengan metode pembelajaran mesin standar dengan hanya menambahkan fitur, yang mewakili longitudinality, misalnya dengan menambahkan fitur yang mewakili waktu. Atau fitur yang menunjukkan keanggotaan ke grup, orang, dll (dalam kasus data panel).

Jika Anda kreatif dengan pembuatan / ekstraksi fitur, Anda dapat memodelkan apa saja dengan algoritma-ML.

PhilippPro
sumber
1
@ PhlippePro, saya agak bingung dengan jawaban ini. (1) Bagaimana jika Anda ingin memprediksi seseorang yang tidak ada dalam pelatihan Anda? Anda hanya memiliki koefisien untuk yang ada di set pelatihan Anda, bukan? (2) Menambahkan fitur yang sesuai dengan orang dapat menghasilkan penambahan hingga 100.000 variabel dummy baru, dengan asumsi Anda memiliki 100.000 orang dalam dataset Anda. Fitur-fitur baru ini akan pas dengan yang asli?
user0
(1) Jika Anda tidak memiliki orang yang ingin Anda prediksi dalam set data pelatihan Anda, maka Anda tidak dapat menggunakan "fitur orang", itu benar. (2) Alih-alih membuat fitur dummy, Anda dapat membuat satu fitur "kategorikal" (mis. Anda menentukannya sebagai kategorikal dengan as.factor di R). Beberapa algoritma tidak dapat menangani begitu banyak kategori (seperti misalnya randomForest hanya dapat menangani sekitar 50), maka Anda benar-benar harus menentukannya sebagai variabel dummy dan Anda bisa mendapatkan (terlalu) banyak fitur, seperti yang Anda tunjukkan.
PhilippPro
ML tidak menerjemahkan dengan mudah menjadi data longitudinal
Aksakal