Kriteria untuk memilih model "terbaik" dalam Model Markov Tersembunyi

12

Saya memiliki kumpulan data deret waktu yang saya coba paskan dengan Hidden Markov Model (HMM) untuk memperkirakan jumlah status laten dalam data. Kode pseudo saya untuk melakukan ini adalah sebagai berikut:

for( i in 2 : max_number_of_states ){ 
    ...
    calculate HMM with i states
    ...
    optimal_number_of_states = "model with smallest BIC"
    ...
}

Sekarang, dalam model regresi yang biasa, BIC cenderung lebih menyukai model yang paling pelit tetapi dalam kasus HMM saya tidak yakin itu yang dilakukannya. Apakah ada yang benar-benar tahu seperti apa HIC kriteria BIC cenderung? Saya juga bisa mendapatkan nilai AIC dan kemungkinan. Karena saya mencoba menyimpulkan jumlah negara yang sebenarnya, apakah salah satu dari kriteria ini "lebih baik" daripada yang lain untuk tujuan ini?

whuber
sumber

Jawaban:

11

Saya berasumsi di sini bahwa variabel output Anda adalah kategoris, meskipun itu mungkin tidak terjadi. Namun biasanya, ketika saya melihat HMM digunakan, jumlah status diketahui lebih dulu daripada dipilih melalui penyetelan. Biasanya mereka sesuai dengan beberapa variabel yang dipahami dengan baik yang kebetulan tidak diamati. Tetapi itu tidak berarti Anda tidak dapat melakukan percobaan dengannya.

Namun, bahaya dalam menggunakan BIC (dan AIC) adalah bahwa nilai k untuk jumlah parameter bebas dalam model meningkat secara kuadratik dengan jumlah status karena Anda memiliki matriks probabilitas transisi dengan parameter Px (P-1) (untuk status P ) dan probabilitas output untuk setiap kategori output yang diberikan masing-masing negara. Jadi jika AIC dan BIC dihitung dengan benar, k harus naik dengan cepat.

Jika Anda memiliki cukup data, saya akan merekomendasikan metode yang lebih lembut untuk menyetel sejumlah status seperti pengujian pada sampel penahan. Anda mungkin juga ingin melihat statistik kemungkinan dan melihat secara visual pada titik mana itu terjadi. Juga jika data Anda besar, perlu diingat bahwa ini akan mendorong BIC ke model yang lebih kecil.

Mike Nute
sumber