Perbedaan antara model Hidden Markov dan Particle Filter (dan Kalman Filter)

21

Ini pertanyaan lama saya

Saya ingin bertanya apakah seseorang mengetahui perbedaan (jika ada perbedaan) antara model Hidden Markov (HMM) dan Particle Filter (PF), dan sebagai konsekuensinya, Kalman Filter, atau dalam kondisi apa kami menggunakan algoritma mana. Saya seorang siswa dan saya harus melakukan proyek, tetapi pertama-tama saya harus memahami beberapa hal.

Jadi, menurut bibliografi, keduanya adalah State Space Model , termasuk status tersembunyi (atau laten atau tidak teramati). Menurut Wikipedia (Hidden_Markov_model)dalam HMM, ruang keadaan variabel tersembunyi adalah diskrit, sedangkan pengamatan itu sendiri dapat diskrit (biasanya dihasilkan dari distribusi kategorikal) atau kontinu (biasanya dari distribusi Gaussian). Model Markov tersembunyi juga dapat digeneralisasi untuk memungkinkan ruang keadaan kontinu. Contoh model tersebut adalah yang mana proses Markov atas variabel tersembunyi adalah sistem dinamik linier, dengan hubungan linier di antara variabel terkait dan di mana semua variabel tersembunyi dan yang diamati mengikuti distribusi Gaussian. Dalam kasus-kasus sederhana, seperti sistem dinamik linier yang baru saja disebutkan, kesimpulan yang tepat dapat ditelusuri (dalam hal ini, menggunakan filter Kalman); Namun, secara umum, inferensi yang tepat dalam HMM dengan variabel laten kontinu tidak layak, dan metode perkiraan harus digunakan,

Tetapi bagi saya ini agak membingungkan ... Dengan kata sederhana apakah ini berarti mengikuti (berdasarkan juga pada penelitian yang telah saya lakukan):

  • Dalam HMM, ruang keadaan bisa diskrit atau kontinu . Juga pengamatan itu sendiri dapat berupa diskrit atau kontinu . HMM juga merupakan sistem dinamik dan Gaussian atau non-Gaussian.
  • Dalam PF, ruang keadaan bisa diskrit atau kontinu . Juga pengamatan itu sendiri dapat berupa diskrit atau kontinu . Tetapi PF adalah sistem dinamik non-linear (dan non-Gaussian?) (Apakah itu bedanya?).
  • Kalman Filter (juga terlihat seperti sama saya seperti HMM) sedang digunakan ketika kita memiliki linear dan Gaussian sistem dinamik.

Juga bagaimana saya tahu algoritma mana yang harus dipilih, karena bagi saya semua ini tampak sama ... Juga saya menemukan makalah (tidak dalam bahasa Inggris) yang mengatakan bahwa PF meskipun dapat memiliki data linier (misalnya data mentah dari sensor-kinect yang mengenali suatu gerakan), sistem dinamik dapat menjadi non-linear. Bisakah ini terjadi? Apakah ini benar? Bagaimana?

Untuk pengenalan gerakan, para peneliti dapat menggunakan HMM atau PF, tetapi mereka tidak menjelaskan mengapa mereka memilih masing-masing algoritma… Apakah ada yang tahu bagaimana saya dapat dibantu untuk membedakan algoritma ini, untuk memahami perbedaan mereka dan bagaimana memilih algoritma terbaik?

Maaf jika pertanyaan saya terlalu besar, atau ada bagian yang naif tetapi saya tidak menemukan jawaban yang meyakinkan dan ilmiah. Terima kasih banyak sebelumnya atas waktu Anda!

Ini pertanyaan baru saya (sesuai dengan bantuan @ conjugateprior)

Jadi dengan bacaan lebih lanjut, saya ingin memperbarui beberapa bagian dari komentar saya sebelumnya, dan untuk memastikan bahwa saya sedikit lebih mengerti apa yang sedang terjadi.

  • Sekali lagi dengan kata-kata sederhana, payungnya adalah jaringan Dynamic Bayesian di mana model HMM dan ruang Negara disertakan (subclass) ( http://mlg.eng.cam.ac.uk/zoubin/papers/ijprai.pdf ).
  • Lebih lanjut, perbedaan awal antara kedua model adalah bahwa, dalam HMM variabel keadaan tersembunyi adalah diskrit , sedangkan pengamatan dapat berupa diskrit atau kontinu . Dalam PF, variabel keadaan tersembunyi adalah kontinu (vektor keadaan tersembunyi bernilai nyata), dan pengamatannya memiliki distribusi Gaussian .
  • Juga menurut @conjugateprior masing-masing model memiliki 3 tugas berikut: penyaringan, perataan dan prediksi. Dalam pemfilteran, model yang digunakan HMM untuk variabel keadaan tersembunyi diskrit, metode Algoritma ke depan, ruang keadaan digunakan untuk variabel kontinu dan sistem dinamis linier, Kalman Filter, dll
  • Namun, HMM juga dapat digeneralisasi untuk memungkinkan ruang keadaan kontinu .
  • Dengan ekstensi HMM ini, 2 model tampaknya identik secara konseptual (seperti yang juga disebutkan dalam Hidden Markov Model vs Markov Transition Model vs State-Space Model ...? ).

Saya pikir saya menggunakan terminologi yang sedikit lebih akurat, tetapi semuanya masih buram bagi saya. Adakah yang bisa menjelaskan kepada saya apa perbedaan antara HMM dan model State Space ?

Karena saya benar-benar tidak dapat menemukan jawaban yang sesuai dengan kebutuhan saya ..

Sekali lagi terima kasih!

user5584748
sumber
1
Jika perpustakaan sekolah Anda memiliki buku ini: crcpress.com/Time-Series-Modeling-Computation-and-Inference/… Saya akan memeriksanya. Itu pekerjaan yang baik untuk menjelaskan ketiga topik yang, saya mungkin sebutkan, adalah tiga topik yang sangat berbeda.
Saya baru saja memeriksa bahwa perpustakaan tidak memiliki buku ini, sayangnya .. jadi jika Anda dapat mengirim saya bagian-bagian yang Anda yakini menjawab pertanyaan saya atau membantu saya untuk juga membedakan topik-topik ini, akan sangat bagus! :)
user5584748

Jawaban:

15

Akan sangat membantu untuk membedakan model dari inferensi yang ingin Anda buat dengannya, karena sekarang terminologi standar menggabungkan keduanya.

Model adalah bagian di mana Anda menentukan sifat : ruang tersembunyi (diskrit atau kontinu), dinamika keadaan tersembunyi (linier atau non-linier) sifat pengamatan (biasanya bersyarat multinomial atau Normal), dan model pengukuran yang menghubungkan keadaan tersembunyi untuk pengamatan. HMM dan model ruang keadaan adalah dua set spesifikasi model tersebut.

tt

Dalam situasi di mana kondisi kontinu, dinamika status, dan pengukuran linier dan semua noise normal, Filter Kalman akan melakukan pekerjaan itu secara efisien. Analoginya ketika status diskrit adalah Algoritma Maju. Dalam hal terdapat non-Normalitas dan / atau non-linearitas, kami kembali ke perkiraan filter. Ada perkiraan deterministik, misalnya Filter Kalman Diperpanjang atau Tidak Beraroma, dan ada perkiraan stokastik, yang paling dikenal di antaranya adalah Filter Partikel.

Perasaan umum tampaknya bahwa dengan adanya non-linearitas yang tidak dapat dihindari dalam keadaan atau bagian pengukuran atau non-Normalitas dalam pengamatan (situasi masalah umum), seseorang mencoba untuk pergi dengan perkiraan termurah yang mungkin. Jadi, EKF lalu UKF lalu PF.

Literatur pada filter Kalian Tanpa Wangi biasanya memiliki beberapa perbandingan situasi ketika itu mungkin bekerja lebih baik daripada linierisasi tradisional dari Filter Kalman Diperpanjang.

Filter Partikel memiliki generalisasi yang hampir lengkap - non-linearitas, distribusi apa pun - tetapi dalam pengalaman saya diperlukan penyetelan yang cukup hati-hati dan umumnya jauh lebih sulit daripada yang lain. Namun dalam banyak situasi, itu satu-satunya pilihan.

Adapun bacaan lebih lanjut: Saya suka bab.4-7 dari Bayesian Filtering dan Smoothing Särkkä, meskipun itu cukup singkat. Penulis membuat memiliki salinan online yang tersedia untuk penggunaan pribadi. Kalau tidak, sebagian besar seri buku waktu ruang angkasa akan membahas materi ini. Untuk Penyaringan Partikel, ada Doucet et al. volume pada topik, tapi saya kira sudah cukup lama sekarang. Mungkin orang lain akan menunjukkan referensi yang lebih baru.

conjugateprior
sumber
Pertama-tama terima kasih banyak atas jawaban Anda. Harap periksa bahwa saya mengedit pertanyaan di atas agar lebih koheren dan akurat dengan terminologi. Saya juga ulangi seluruh pertanyaan saya.
user5584748
Dalam penulisan ulang Anda, tidak sepenuhnya benar bahwa "Dalam PF variabel keadaan tersembunyi adalah kontinu (vektor keadaan tersembunyi bernilai riil), dan pengamatan memiliki distribusi Gaussian." PF adalah filter. Model yang merupakan filter harus memiliki ruang keadaan kontinu (dengan beberapa struktur Markovian atau lainnya) tetapi tidak dibatasi: distribusi apa pun, dinamika apa pun, dan proses pengukuran apa pun.
conjugateprior
Anda bisa, misalnya, menggunakan PF untuk memfilter model ruang keadaan Gaussian linear biasa. Ini akan bekerja dengan baik. Anda tidak perlu melakukannya karena filter Kalman tepat.
conjugateprior
4
"Apa perbedaan antara model HMM dan State Space?" Pada dasarnya: Berdasarkan konvensi, HMM memiliki kondisi diskrit. Juga berdasarkan konvensi, 'model ruang angkasa' menunjukkan hal-hal dengan keadaan terus menerus.
conjugateprior
Terima kasih banyak! Jadi perbedaan ini terjadi oleh konvensi (dan menurut daftar pustaka). Tetapi secara umum, kita dapat memilih model mana yang kita inginkan. Apakah itu benar? Model yang akan saya pilih tergantung pada apakah saya akan mendapatkan hasil yang lebih baik?
user5584748