Apa perbedaan antara jaringan Bayes (dinamis) dan HMM?

14

Saya telah membaca bahwa HMM, Filter Partikel dan filter Kalman adalah kasus khusus dari jaringan Bayes yang dinamis. Namun, saya hanya tahu HMM dan saya tidak melihat perbedaan pada jaringan Bayes yang dinamis.

Bisakah seseorang tolong jelaskan?

Akan lebih baik jika jawaban Anda bisa mirip dengan yang berikut, tetapi untuk bayes Networks:

Model Markov Tersembunyi

Hidden Markov Model (HMM) adalah 5-tuple :λ=(S,HAI,SEBUAH,B,Π)

  • S : Seperangkat keadaan (mis. "Awal fonem", "tengah fonem", "akhir fonem")
  • O : Satu set pengamatan yang memungkinkan (sinyal audio)
  • AR|S|×|S| : Matriks stokastik yang memberikan probabilites untuk mendapatkan dari state i ke state j .(aij)sayaj
  • BR|S|×|O|: Sebuah matriks stokastik yang memberikan probabilites(bkl) untuk mendapatkan keadaank pengamatanl .
  • ΠR|S|: Distribusi awal untuk memulai di salah satu negara.

Biasanya ditampilkan sebagai grafik terarah, di mana setiap node sesuai dengan satu negara dan probabilitas transisi dilambangkan di tepi.sS

Hidden Markov Models disebut "tersembunyi", karena keadaan saat ini disembunyikan. Algoritma harus menebaknya dari pengamatan dan model itu sendiri. Mereka disebut "Markov", karena untuk negara berikutnya hanya keadaan saat ini yang penting.

Untuk HMM, Anda memberikan topologi tetap (jumlah status, kemungkinan tepi). Lalu ada 3 tugas yang mungkin

  • Evaluasi : diberi HMM , bagaimana mungkin itu untuk mendapatkan pengamatan o 1 , ... , o t (algoritma Forward)λo1,,ot
  • Decoding : diberi HMM dan pengamatan o 1 , ... , o t , apa yang paling mungkin urutan negara s 1 , ... , s t (algoritma Viterbi)λo1,,ots1,,st
  • Belajar : belajar : Algoritma Baum-Welch , yang merupakan kasus khusus dari maksimisasi Ekspektasi.A,B,Π

Jaringan Bayes

Jaringan Bayes adalah grafik asiklik langsung (DAG) . Node mewakili variabel acak X X . Untuk setiap X , ada distribusi probabilitas yang dikondisikan pada orang tua X :G=(X,E)XXXX

P(X|parents(X))

Tampaknya ada (tolong jelaskan) dua tugas:

  • Kesimpulan : Diberikan beberapa variabel, dapatkan nilai yang paling mungkin dari variabel lain. Inferensi yang tepat adalah NP-hard. Kira-kira, Anda bisa menggunakan MCMC.
  • Belajar : Bagaimana Anda mempelajari distribusi itu tergantung pada masalah yang sebenarnya ( sumber ):

    • struktur yang diketahui, dapat diamati sepenuhnya: estimasi kemungkinan maksimum (MLE)
    • struktur yang diketahui, dapat diamati sebagian: Maksimalisasi Ekspektasi (EM) atau Rantai Markov Monte Carlo (MCMC)
    • struktur tidak dikenal, dapat diamati sepenuhnya: mencari melalui ruang model
    • struktur tidak dikenal, dapat diamati sebagian: pencarian EM + melalui ruang model

Jaringan Dynamic Bayes

Saya kira jaringan Bayes dinamis (DBNs) juga diarahkan model grafis probabilistik. Keragaman tampaknya berasal dari jaringan yang berubah seiring waktu. Namun, tampaknya bagi saya bahwa ini setara dengan hanya menyalin jaringan yang sama dan menghubungkan setiap simpul pada waktu dengan setiap node yang sesuai pada waktu t + 1 . Apakah itu masalahnya?tt+1

Martin Thoma
sumber
2
1. Anda juga dapat mempelajari topologi HMM. 2. Saat melakukan inferensi dengan BNs, selain meminta estimasi kemungkinan maksimum, Anda juga dapat mengambil sampel dari distribusi, memperkirakan probabilitas, atau melakukan apa pun yang memungkinkan teori probabilitas memungkinkan Anda. 3. DBN hanyalah BN yang disalin dari waktu ke waktu, dengan beberapa (tidak semua) node dirantai dari masa lalu ke masa depan. Dalam hal ini, HMM adalah DBN sederhana dengan hanya dua node di setiap slice waktu dan salah satu node dirantai dari waktu ke waktu.
KT.
Saya bertanya kepada seseorang tentang hal ini dan mereka berkata: "HMM hanyalah kasus khusus dari jaring Bayes dinamis, dengan setiap potongan waktu berisi satu variabel laten, bergantung pada yang sebelumnya untuk memberikan rantai Markov, dan satu pengamatan tergantung pada masing-masing variabel laten. DBNs dapat memiliki struktur apa pun yang berkembang seiring waktu. "
ashley

Jawaban:

1

Dari pertanyaan serupa Palang Validasi berikut @jerad jawabannya:

HMM tidak setara dengan DBN, melainkan merupakan kasus khusus DBN di mana seluruh negara di dunia diwakili oleh satu variabel keadaan tersembunyi. Model-model lain dalam kerangka kerja DBN menggeneralisasi HMM dasar, memungkinkan lebih banyak variabel status tersembunyi (lihat makalah kedua di atas untuk banyak varietas).

Akhirnya, tidak, DBN tidak selalu terpisah. Misalnya, model keadaan Gaussian linier (Filter Kalman) dapat dipahami sebagai HMM bernilai kontinu, sering digunakan untuk melacak objek di ruang angkasa.

Saya akan merekomendasikan melihat melalui dua makalah ulasan yang sangat baik ini:

xboard
sumber