Bagaimana para ilmuwan menghasilkan parameter dan topologi Hidden Markov Model yang benar untuk digunakan?

10

Saya mengerti bagaimana Model Markov Tersembunyi digunakan dalam sekuens genom, seperti menemukan gen. Tapi saya tidak mengerti bagaimana membuat model Markov tertentu. Maksud saya, berapa banyak negara yang seharusnya dimiliki oleh model? Berapa banyak kemungkinan transisi? Haruskah model memiliki loop?

Bagaimana mereka tahu bahwa model mereka optimal?

Apakah mereka membayangkan, mengatakan 10 model yang berbeda, membandingkan 10 model tersebut dan menerbitkan yang terbaik?

Halo Dunia
sumber

Jawaban:

6

Saya akrab dengan tiga pendekatan utama:

  1. A priori. Anda mungkin tahu bahwa ada empat pasangan basa untuk dipilih, dan biarkan HMM memiliki empat negara. Atau Anda mungkin tahu bahwa bahasa Inggris memiliki 44 fonem, dan memiliki 44 status untuk lapisan fonem tersembunyi dalam model pengenalan suara.

  2. Perkiraan. Jumlah negara sering dapat diperkirakan sebelumnya, mungkin dengan pengelompokan sederhana pada fitur yang diamati dari HMM. Jika matriks transisi HMM adalah segitiga (yang sering terjadi dalam prediksi kegagalan), jumlah negara menentukan bentuk distribusi total waktu dari keadaan mulai ke keadaan akhir.

  3. Optimasi. Seperti yang Anda sarankan, banyak model dibuat dan cocok dan model terbaik dipilih. Kita juga bisa mengadaptasi metodologi yang mempelajari HMM untuk memungkinkan model untuk menambah atau membuang status yang diperlukan.

Matthew Graves
sumber
1

Pendekatan lebih lanjut adalah untuk mengambil sampel dari model-model dengan jumlah status tak terhingga yang tak terhitung jumlahnya. Jawaban untuk 'berapa banyak' kemudian akan muncul dengan rata-rata sampler.

http://mlg.eng.cam.ac.uk/zoubin/papers/ihmm.pdf

dugaan
sumber