Hidden Markov Model vs Markov Transition Model vs State-Space Model ...?

18

Untuk tesis master saya, saya sedang bekerja mengembangkan model statistik untuk transisi antara negara yang berbeda, yang didefinisikan oleh status serologis. Untuk saat ini, saya tidak akan memberikan terlalu banyak detail dalam konteks ini, karena pertanyaan saya lebih umum / teoretis. Bagaimanapun, intuisi saya adalah bahwa saya harus menggunakan Hidden Markov Model (HMM); masalah yang saya temui ketika saya membaca literatur dan penelitian latar belakang lainnya yang diperlukan untuk merumuskan model saya adalah kebingungan tentang terminologi dan perbedaan yang tepat antara berbagai jenis model proses tersembunyi. Saya hanya sangat samar-samar menyadari apa yang membedakan mereka (contoh yang akan datang). Terlebih lagi, bagi saya, setidaknya dari apa yang saya lihat dalam literatur, ada kosakata yang sangat tidak standar yang dibangun di sekitar jenis pemodelan ini,

Jadi, saya berharap orang-orang dapat membantu saya menyatukan beberapa istilah ini untuk saya. Saya memiliki sejumlah pertanyaan, tetapi saya menduga bahwa ketika satu atau dua dijawab dengan memuaskan sisanya akan menjadi berantakan. Saya harap ini tidak terlalu panjang lebar; jika seorang moderator ingin saya membaginya menjadi beberapa posting, saya akan melakukannya. Bagaimanapun, saya telah mengajukan pertanyaan saya dengan berani, diikuti oleh rincian pertanyaan yang telah saya temukan selama pencarian literatur saya.

Jadi, tanpa urutan tertentu:

1) Apa sebenarnya "model proses tersembunyi"?

Saya telah beroperasi di bawah kesan bahwa "model proses tersembunyi" adalah semacam istilah umum yang dapat digunakan untuk menggambarkan sejumlah jenis model statistik, semua pada dasarnya deskripsi probabilistik dari data deret waktu yang dihasilkan oleh "sistem tumpang tindih," berpotensi tersembunyi, proses aditif linear "([1]). Memang, [2] mendefinisikan "model proses tersembunyi" sebagai "istilah umum yang mengacu pada model ruang-negara atau model Markov tersembunyi." [1] tampaknya menyimpulkan bahwa model Markov tersembunyi adalah subtipe dari model proses tersembunyi yang secara khusus diarahkan pada inferensi pada status biner; implikasi dasar menurut saya bahwa model proses tersembunyi adalah generalisasi dari model Markov yang tersembunyi. Terkadang saya melihat "model proses tersembunyi" DAN frasa "

Apakah intuisi saya benar? Jika tidak, apakah ada yang punya referensi yang lebih jelas menggambarkan metode ini?

2) Apa perbedaan antara Model Markov Tersembunyi dan model ruang-negara?

Kembali lagi ke [2] (jika hanya karena makalah tersebut dilengkapi dengan istilah yang jelas, bukan karena makalah itu sendiri tampaknya sangat otoritatif; itu hanya sumber yang nyaman untuk definisi satu kalimat), perbedaannya tampaknya adalah bahwa Hidden Markov Model adalah tipe spesifik dari model state-space di mana state adalah Markovian (tampaknya tidak ada batasan pasti pada urutan proses Markov; yaitu urutan pertama, ..., urutan ke-k). Di sini, model state-space didefinisikan sebagai "Sebuah model yang menjalankan dua deret waktu secara paralel, yang satu menangkap dinamika keadaan sebenarnya (laten) dan yang lainnya terdiri dari pengamatan yang dibuat dari keadaan yang mendasarinya tetapi kemungkinan tidak diketahui." Jika negara-negara tersebut juga memamerkan properti Markov, maka itu adalah Model Markov Tersembunyi.

Namun, [3] mendefinisikan perbedaan antara model ruang-negara dan Model Hidden Markov sebagai yang terkait dengan karakteristik dari kondisi laten. Di sini, Model Markov Tersembunyi berurusan dengan keadaan diskrit sementara model ruang-negara berurusan dengan keadaan kontinu; jika tidak, mereka secara konseptual identik.

Bagi saya ini adalah dua definisi yang sangat berbeda. Di bawah satu, Hidden Markov Model adalah subtipe dari model state-space, sedangkan di bawah yang lain keduanya hanya berbeda instantiations dari kelas yang lebih luas dari model proses tersembunyi. Yang mana yang benar? Intuisi saya menunjukkan saya untuk mengikuti [3] yang bertentangan dengan [2], tetapi saya tidak dapat menemukan sumber otoritatif yang mendukung ini.

3) Apa itu "model transisi Markov"?

Istilah lain yang muncul dalam banyak sumber adalah "model transisi Markov". Saya belum dapat menemukan frasa ini di buku teks apa pun, tetapi ini muncul banyak dalam artikel jurnal (cukup tancapkan ke Google untuk mengonfirmasi). Saya belum dapat menemukan definisi yang tepat dari istilah tersebut (setiap kertas yang saya temukan mengutip kertas lain, yang mengutip yang lain, dll., Mengirim saya ke lubang kelinci PubMed yang mengarah ke tempat yang tidak waras). Kesan saya dari konteks adalah bahwa ini adalah istilah yang sangat umum untuk merujuk pada model apa pun di mana objek inferensi adalah transisi antara negara-negara yang mengikuti proses Markov, dan bahwa Model Markov Tersembunyi dapat dianggap sebagai tipe spesifik dari model transisi Markov . [4], bagaimanapun, tampaknya menggunakan model transisi, Hidden Markov Model, dan beberapa istilah serupa secara bergantian.

Di sisi lain, [5] berbicara tentang model transisi Markov dan Hidden Markov Model sedikit berbeda. Penulis menyatakan: "Model transisi menyediakan metode untuk meringkas dinamika responden yang membantu untuk menafsirkan hasil dari model Markov tersembunyi yang lebih kompleks". Saya tidak sepenuhnya mengerti apa yang mereka maksudkan dengan frasa ini, dan tidak dapat menemukan pembenaran untuknya di tempat lain di koran. Namun, mereka tampaknya menyiratkan bahwa model transisi Markov menggunakan waktu sebagai variabel kontinu, sementara model Markov tersembunyi menggunakan waktu sebagai variabel diskrit (mereka tidak secara langsung mengatakan ini; mereka mengatakan mereka menggunakan paket R 'msm' agar sesuai dengan transisi Markov model, dan kemudian menggambarkan 'msm' sebagai memperlakukan waktu terus menerus berbeda dengan paket R untuk HMMs).

4) Di mana konsep-konsep lain, misalnya Dynamic Bayesian Networks, cocok?

Menurut Wikipedia, Dynamic Bayesian Network adalah "generalisasi model Markov tersembunyi dan filter Kalman". Di tempat lain, saya telah melihat model Markov tersembunyi didefinisikan sebagai kasus khusus dari Dynamic Bayesian Network, "yang seluruh negara di dunia diwakili oleh variabel keadaan tersembunyi tunggal" ( Definisi sistem Bayesian dinamis, dan hubungannya dengan HMM? ) . Saya umumnya memahami hubungan ini, dan itu dijelaskan dengan baik oleh [6].

Namun, saya kesulitan memahami bagaimana hubungan ini cocok dengan gambaran yang lebih luas. Artinya, mengingat hubungan antara HMMs dan DBNs, bagaimana model state-space dan model proses tersembunyi terkait dengan keduanya? Bagaimana semua jenis metode yang berbeda ini saling terkait, mengingat bahwa tampaknya ada beberapa "generalisasi" model Markov tersembunyi?


Referensi:

[1] Tom M. Mitchell, Rebecca Hutchinson, Indrayana Rustandi. "Model Proses Tersembunyi". 2006. CMU-CALD-05-116. Universitas Carnegie Mellon.

[2] Oliver Giminez, Jean-Dominique Lebreton, Jean-Michel Gaillard, Remi Choquet, Roger Pradel. + Msgstr "Memperkirakan parameter demografis menggunakan model dinamis proses tersembunyi". Biologi Populasi Teoritis. 2012. 82 (4): 307-316.

[3] Barbara Engelhardt. "Model Markov Tersembunyi dan Model Antariksa Negara". STA561: Pembelajaran mesin probabilistik. Universitas Duke. http://www.genome.duke.edu/labs/engelhardt/courses/scribe/lec_09_25_2013.pdf

[4] Jeroen K. Vermunt. "Pemodelan Markov Laten Bertingkat dalam Waktu Berkelanjutan dengan Aplikasi untuk Analisis Data Penilaian Suasana Ambulatory". Lokakarya Statistik Sosial. 2012. Universitas Tilburg. http://www.lse.ac.uk/statistics/events/SpecialEventsandConferences/LSE2013-Vermunt.pdf

[5] Ken Richardson, David Harte, Kristie Carter. "Memahami transisi kesehatan dan angkatan kerja: Menerapkan model Markov ke data longitudinal SoFIE". Seri Penelitian Statistik Resmi. 2012

[6] Zoubin Ghahramani. "Pengantar Model Markov Tersembunyi dan Jaringan Bayesian". Jurnal Pengakuan Pola dan Kecerdasan Buatan. 2001. 15 (1): 9-42.

Ryan Simmons
sumber
Anda mungkin juga ingin mencoba Jaringan Syaraf Berulang. Dalam pengenalan ucapan, beberapa telah menggunakannya dengan sukses sebagai pengganti HMM.
Albert
Terima kasih atas sarannya. Tetapi pada saat ini saya lebih memilih untuk mengklarifikasi pertanyaan saya tentang teknik-teknik ini sebelum melanjutkan untuk mempelajari yang baru.
Ryan Simmons
Mereka merujuk hal yang sama. Silakan lihat scholarpedia.org/article/State_space_model Sangdon
2
@Ryan Simmons Saya pikir ini akan menjadi ide yang bagus untuk melihat video Mathematicalmonk (alias Jeffrey Miller) tentang rantai markov dan model markov tersembunyi di youtube.
JimBoy
Karena Anda mungkin sudah menyerahkan tesis Anda sekarang, maukah Anda menjawab sendiri pertanyaan ini? Saya ingin seorang ahli menjawab di sini, yang mungkin berlaku juga untuk hampir 800 orang lain yang membaca pertanyaan ini.
Ulf Aslak

Jawaban:

4

Berikut ini dikutip dari situs web Scholarpedia :

State space model (SSM) mengacu pada kelas model grafis probabilistik (Koller dan Friedman, 2009) yang menggambarkan ketergantungan probabilistik antara variabel keadaan laten dan pengukuran yang diamati. Status atau pengukuran dapat berupa kontinu atau diskrit. Istilah "ruang negara" berasal pada 1960-an di bidang teknik kontrol (Kalman, 1960). SSM menyediakan kerangka kerja umum untuk menganalisis sistem dinamik deterministik dan stokastik yang diukur atau diamati melalui proses stokastik. Kerangka SSM telah berhasil diterapkan dalam bidang teknik, statistik, ilmu komputer dan ekonomi untuk memecahkan berbagai masalah sistem dinamik. Istilah lain yang digunakan untuk menggambarkan SSM adalah model Markov tersembunyi (HMM) (Rabiner, 1989) dan model proses laten. SSM yang paling banyak dipelajari adalah filter Kalman,

pengguna93693
sumber
3

Saya dan Alan Hawkes telah menulis cukup banyak tentang proses Markov agregat dengan status diskrit dalam waktu terus menerus. Barang-barang kami adalah tentang masalah menafsirkan pengamatan molekul saluran ion tunggal, dan termasuk pengobatan yang tepat untuk peristiwa pendek yang terlewat. Teori serupa juga bekerja dalam teori reliabilitas. Mungkin juga disesuaikan dengan masalah lain. Lihat http://www.onemol.org.uk/?page_id=175 untuk referensi.

David Colquhoun
sumber