Rekan saya dan saya sedang menyesuaikan serangkaian model efek campuran linier dan nonlinear dalam R. Kami diminta untuk melakukan validasi silang pada model yang dipasang sehingga orang dapat memverifikasi bahwa efek yang diamati relatif dapat digeneralisasikan. Ini biasanya tugas yang sepele, tetapi dalam kasus kami, kami harus membagi seluruh data menjadi bagian pelatihan dan bagian pengujian (untuk tujuan CV) yang tidak memiliki level yang sama. Sebagai contoh,
Data pelatihan dapat didasarkan pada Grup 1,2,3,4; Model yang cocok kemudian divalidasi silang pada Grup 5.
Jadi ini menciptakan masalah karena efek acak berbasis kelompok yang diperkirakan pada data pelatihan tidak berlaku untuk data pengujian. Jadi, kita tidak bisa membuat CV model.
Apakah ada solusi yang relatif mudah untuk ini? Atau adakah yang sudah menulis paket untuk mengatasi masalah ini? Ada petunjuk apa pun!
Terima kasih!
sumber
Jawaban:
Fang (2011) telah menunjukkan kesetaraan asimptotik antara AIC yang diterapkan pada model campuran dan validasi silang keluar satu cluster. Mungkin ini akan memuaskan pengulas Anda, memungkinkan Anda untuk hanya menghitung AIC sebagai pendekatan yang lebih mudah untuk menghitung apa yang mereka minta?
sumber
Colby dan Bair (2013) telah mengembangkan pendekatan cross-validasi yang dapat diterapkan pada model efek campuran nonlinier. Anda dapat mengunjungi tautan ini untuk mempelajari lebih lanjut.
sumber