Perbedaan antara jaringan Bayesian dan proses Markov?

28

Apa perbedaan antara Bayesian Network dan proses Markov?

Saya percaya saya mengerti prinsip-prinsip keduanya, tetapi sekarang ketika saya harus membandingkan keduanya saya merasa kehilangan. Artinya hampir sama bagi saya. Tentunya tidak.

Tautan ke sumber daya lain juga dihargai.

rockstar
sumber
Saya ingat seseorang mengatakan kepada saya di situs ini, jaringan Bayesian tidak selalu memerlukan inferensi Bayesian. Nama mereka berasal dari aturan Bayes.
Tim

Jawaban:

21

Sebuah model grafis probabilistik (PGM) adalah formalisme grafik untuk kompak pemodelan distribusi probabilitas gabungan dan (di) hubungan ketergantungan lebih satu set variabel acak. PGM disebut jaringan Bayesian ketika grafik yang mendasarinya diarahkan, dan bidang acak Markov jaringan / Markovketika grafik yang mendasarinya tidak diarahkan. Secara umum, Anda menggunakan yang pertama untuk memodelkan pengaruh probabilistik antara variabel yang memiliki arah yang jelas, jika tidak Anda menggunakan yang terakhir; di kedua versi PGM, kurangnya tepi dalam grafik terkait mewakili independensi bersyarat dalam distribusi yang dikodekan, meskipun semantik persisnya berbeda. "Markov" dalam "jaringan Markov" mengacu pada gagasan umum tentang independensi kondisional yang dikodekan oleh PGM, yaitu sekumpulan variabel acak xA tidak tergantung pada yang lain xC diberi beberapa set variabel "penting" xB (nama teknis adalah selimut Markov ), yaitup(xA|xB,xC)=p(xA|xB) .

Sebuah proses Markov adalah proses stokastik {Xt} yang memenuhi satu properti Markov . Berikut penekanannya pada koleksi (skalar) variabel acak X1,X2,X3,...biasanya dianggap sebagai diindeks oleh waktu, yang memenuhi jenis tertentu dari kemerdekaan bersyarat, yaitu, "masa depan adalah independen dari masa lalu mengingat masa kini", secara kasar berbicara p(xt+1|xt,xt1,...,x1)=p(xt+1|xt) . Ini adalah kasus khusus dari gagasan 'Markov' yang ditentukan oleh PGM: cukup ambil himpunanA={t+1},B={t} , dan ambilC untuk menjadi bagian dari{t1,t2,...,1}dan aktifkan pernyataan sebelumnya p(xA|xB,xC)=p(xA|xB) . Dari sini kita melihat bahwa Markov selimut dari setiap variabel Xt+1 adalah pendahulunya Xt .

Oleh karena itu Anda dapat mewakili proses Markov dengan jaringan Bayesian , sebagai rantai linier yang diindeks oleh waktu (untuk kesederhanaan kami hanya mempertimbangkan kasus waktu / keadaan diskrit di sini; gambar dari buku PRML Uskup): masukkan deskripsi gambar di sini Jenis jaringan Bayesian ini dikenal sebagai jaringan Bayesian yang dinamis . Karena ini adalah jaringan Bayesian (maka PGM), seseorang dapat menerapkan algoritma PGM standar untuk inferensi probabilistik (seperti algoritma penjumlahan produk, yang persamaan Chapman − Kolmogorov mewakili kasus khusus) dan estimasi parameter (misalnya kemungkinan maksimum, yang mendidih ke penghitungan sederhana) di atas rantai. Contoh aplikasi ini adalah model bahasa HMM dan n-gram.

Seringkali Anda melihat diagram penggambaran rantai Markov seperti inimasukkan deskripsi gambar di sini

p(Xt|Xt1)Xt(Xt(1),...Xt(D))p(Xt(1),...Xt(D)|Xt1(1),...Xt1(D))

Xttp(xt+1|xt,xt1,...,x1)=p(xt+1|xt)

Yibo Yang
sumber
17

Pertama beberapa kata tentang Proses Markov. Ada empat rasa berbeda dari binatang itu, tergantung pada ruang keadaan (diskrit / kontinu) dan variabel waktu (diskrit / kontinyu). Gagasan umum dari setiap Proses Markov adalah bahwa "mengingat saat ini, masa depan tidak tergantung pada masa lalu".

Proses Markov yang paling sederhana, adalah ruang diskrit dan terbatas, dan waktu Markov Chain terpisah. Anda dapat memvisualisasikannya sebagai satu set node, dengan tepi terarah di antara mereka. Grafik mungkin memiliki siklus, dan bahkan loop. Di setiap tepi Anda dapat menulis angka antara 0 dan 1, sedemikian rupa, sehingga untuk setiap nomor simpul di tepi keluar dari jumlah simpul ke 1.

Sekarang bayangkan proses berikut: Anda mulai dalam keadaan tertentu A. Setiap detik, Anda memilih secara acak tepi keluar dari keadaan Anda saat ini, dengan kemungkinan memilih tepi itu sama dengan angka di tepi itu. Sedemikian rupa, Anda menghasilkan secara acak urutan negara.

Visualisasi yang sangat keren dari proses semacam itu dapat ditemukan di sini: http://setosa.io/blog/2014/07/26/markov-chains/

Pesan takeaway adalah, bahwa representasi grafis dari ruang diskrit waktu diskrit Proses Markov adalah grafik umum, yang mewakili distribusi pada urutan node grafik (diberi titik awal, atau distribusi awal pada titik).

Di sisi lain, Bayesian Network adalah DAG ( Directed Acyclic Graph ) yang merepresentasikan faktorisasi dari beberapa distribusi probabilitas gabungan. Biasanya representasi ini mencoba memperhitungkan independensi kondisional antara beberapa variabel, untuk menyederhanakan grafik dan mengurangi jumlah parameter yang diperlukan untuk memperkirakan distribusi probabilitas gabungan.

sjm.majewski
sumber
3

Ketika saya sedang mencari jawaban untuk pertanyaan yang sama, saya menemukan jawaban ini. Tapi tidak ada dari mereka yang menjelaskan topik tersebut. Ketika saya menemukan beberapa penjelasan yang baik, saya ingin berbagi dengan orang-orang yang berpikir seperti saya.

Dalam buku "Penalaran probabilistik dalam sistem cerdas: Networks of Plausible Inference" yang ditulis oleh Judea Pearl, bab 3: Markov dan Bayesian Networks: Dua Representasi Grafis dari Pengetahuan Probabilistik, hal.116:

Kelemahan utama jaringan Markov adalah ketidakmampuannya untuk mewakili dependensi yang diinduksi dan non-transitif; dua variabel independen akan dihubungkan secara langsung oleh edge, hanya karena beberapa variabel lain bergantung pada keduanya. Akibatnya, banyak independensi yang bermanfaat tidak terwakili dalam jaringan. Untuk mengatasi kekurangan ini, jaringan Bayesian menggunakan bahasa yang lebih kaya dari grafik terarah , di mana arah panah memungkinkan kita untuk membedakan ketergantungan asli dari ketergantungan palsu yang disebabkan oleh pengamatan hipotetis.

Vezir
sumber
1

Proses Markov adalah proses stokastik dengan properti Markovian (ketika indeks adalah waktu, properti Markovian adalah independensi kondisional khusus, yang mengatakan diberikan sekarang, masa lalu dan masa depan adalah independen.)

Jaringan Bayesian adalah model grafis terarah. (Bidang acak Markov adalah model grafis tidak terarah.) Model grafis menangkap independensi bersyarat, yang dapat berbeda dari properti Markovian.

Saya tidak terbiasa dengan model grafis, tetapi saya pikir model grafis dapat dilihat sebagai proses stokastik.

Tim
sumber
1

-Ide umum dari setiap Proses Markov adalah bahwa "mengingat saat ini, masa depan tidak tergantung dari masa lalu".

- Gagasan umum dari setiap metode Bayesian adalah bahwa "mengingat sebelumnya, masa depan tidak tergantung pada masa lalu", parameternya, jika diindeks oleh pengamatan, akan mengikuti proses Markov

PLUS

"Semua yang berikut ini akan sama dengan cara saya memperbarui kepercayaan saya

  • Anda memberi saya informasi baru A, maka Anda memberi saya informasi baru B,
  • Anda memberi saya informasi baru B, lalu informasi baru A
  • Anda memberi saya A dan B bersama "

Jadi parameternya akan benar-benar menjadi proses Markov yang diindeks oleh waktu, dan bukan oleh pengamatan

nicolas
sumber