Saat ini saya membaca beberapa makalah tentang penggumpalan rantai Markov dan saya gagal melihat perbedaan antara rantai Markov dan grafik tertimbang sederhana yang diarahkan.
Sebagai contoh dalam artikel Optimal penggumpalan ruang-negara di rantai Markov, mereka memberikan definisi CTMC (rantai Markov waktu kontinu) sebagai berikut:
Kami menganggap CTMC terbatas dengan ruang state oleh matriks laju transisi .S = { x 1 , x 2 , … , x n } Q : S × S → R +
Mereka tidak menyebutkan properti Markov sama sekali, dan, pada kenyataannya, jika bobot di tepi mewakili probabilitas saya percaya properti Markov sepele memegangnya karena probabilitas hanya bergantung pada keadaan rantai saat ini dan bukan jalur yang mengarah untuk itu.
Dalam artikel lain Pada Relational Properties of Lumpability, rantai Markov didefinisikan dengan cara yang sama:
Rantai Markov akan direpresentasikan sebagai triplet mana adalah himpunan terbatas dari keadaan , matriks probabilitas transisi yang menunjukkan probabilitas untuk berpindah dari satu keadaan ke keadaan lain, dan adalah distribusi probabilitas awal yang mewakili kemungkinan sistem mulai dalam keadaan tertentu.( S , P , π ) S M P π
Sekali lagi, tidak disebutkan masa lalu atau masa depan atau kemerdekaan.
Ada makalah ketiga Simple O (m logn) Time Markov Chain Lumping di mana mereka tidak hanya tidak pernah menyatakan bahwa bobot pada tepian adalah probabilitas, tetapi mereka bahkan mengatakan:
Dalam banyak aplikasi, nilai tidak negatif. Namun, kami tidak membuat asumsi ini, karena ada juga aplikasi di mana sengaja dipilih sebagai , sehingga biasanya negatif.W ( s , s ) - W ( s , S ∖ { s } )
Selain itu, dinyatakan bahwa lumping harus menjadi cara untuk mengurangi jumlah negara sambil mempertahankan properti Markov (dengan menggabungkan negara "setara" menjadi negara yang lebih besar). Namun, bagi saya, sepertinya itu hanya menjumlahkan probabilitas dan bahkan seharusnya tidak menjamin bahwa kemampuan transisi yang dihasilkan ke / dari keadaan agregat berada dalam kisaran . Apa sebenarnya yang dipertahankan benjolan itu?
Jadi, ada dua kemungkinan yang saya lihat:
- Saya tidak mengerti apa itu rantai Markov, atau
- Penggunaan istilah rantai Markov di koran-koran itu palsu
Bisakah seseorang mengklarifikasi situasinya?
Sepertinya ada banyak komunitas yang menggunakan istilah itu dan mereka sangat berbeda. Dari 3 artikel yang saya pertimbangkan ini sepertinya properti Markov adalah sepele atau tidak berguna, sambil melihat berbagai jenis kertas yang terlihat mendasar.
Jawaban:
Sebuah Continuous-waktu Markov Chain dapat direpresentasikan sebagai grafik diarahkan dengan konstan bobot tepi non-negatif. Representasi yang setara dari bobot tepi konstan grafik berarah dengan node adalah sebagai matriksThe Markov properti (bahwa masa depan negara tergantung hanya pada keadaan saat ini) adalah implisit dalam bobot tepi konstan (atau entri konstan dalam matriks). Implisit berarti tersirat oleh . Matematikawan menggunakannya sebagai makna eufemisme, "Anda harus membuktikannya sendiri."N × NN N×N
Tetapi kertas pertama mendefinisikan notasi yang konsisten dengan Rantai Markov waktu-berkelanjutan , kadang-kadang disebut Proses Markov , sedangkan kertas kedua mendefinisikan notasi yang konsisten dengan Rantai Markov waktu diskrit . Mereka bilang
Mereka mengasumsikan bahwa matriks konstan dari waktu ke waktu (sehingga menyiratkan properti Markov). Tersirat dalam probabilitas istilah adalah kenyataan bahwa setiap konstanta dalam kisaran , bahwa entri dalam setiap kolom jumlah ke , dan bahwa jumlah entri dalam jumlah ke .P 1 π 1[0,1] P 1 π 1
Saya tidak bisa membaca makalah ketiga, itu paywalled. Jika entri dalam setiap kolom dari matriks diharuskan untuk menjumlahkan ke 1 maka mereka adalah probabilitas dan mereka berbicara tentang Rantai Markov waktu diskrit. Jika entri di setiap kolom dapat jumlah ke angka sewenang-wenang maka entri mewakili tingkat bukan probabilitas dan mereka berbicara tentang Rantai Markov waktu-berkelanjutan.
Dengan Chains Markov Continous-time dan Discrete-time, properti Markov tersirat oleh bobot tepi konstan (atau setara dengan entri konstan dalam matriks transisi).
sumber
Rantai Markov datang dalam dua rasa: waktu kontinu dan waktu diskrit.
Baik rantai markov waktu kontinu (CTMC) dan rantai markov waktu diskrit (DTMC) direpresentasikan sebagai grafik tertimbang yang diarahkan.
Untuk DTMC, transisinya selalu membutuhkan satu unit "waktu". Akibatnya, tidak ada pilihan untuk berapa berat Anda pada busur seharusnya - Anda menempatkan kemungkinan pergi ke "j" mengingat bahwa Anda berada di "i."
Untuk CTMC, waktu transisi antara dua keadaan harus diberikan oleh variabel acak eksponensial. Ini adalah perbedaan utama antara CTMC dan DTMC: DTMC selalu memiliki waktu transisi unit. CTMC memiliki waktu transisi acak.
Untuk CTMC, konvensi umumnya untuk meletakkan bobot pada busur sesuai dengan tingkat variabel acak eksponensial pergi dari sumber ke tujuan. Itu adalah - konvensi adalah untuk memberi nilai pada busur, bukan probabilitas.
Tarif Negatif
Meskipun semua CTMC yang saya ingat diwakili dengan tingkat positif di tepinya, tingkat negatif muncul dalam analisis CTMC.
Katakanlah kita berdiri di negara A, yang terhubung ke B, C, dan D seperti di bawah ini.
A -> B (laju ke A dari B negatif) A -> C (laju ke A dari C negatif) D -> A (laju ke A dari D adalah positif)
Ini kemungkinan tidak sesuai dengan makalah Anda; Saya membawanya untuk menunjukkan bahwa bobot negatif tidak selalu konyol jika seseorang bekerja dengan konvensi yang sesuai.
Markov Property
Untuk DTMC - Anda benar. Properti markov puas sepele. Untuk CTMC, properti markov puas karena transisi diberikan oleh variabel acak eksponensial (yang "tanpa memori"). Jika transisi tidak diberikan oleh variabel acak eksponensial (katakan saja mereka seragam), maka kita akan berbicara tentang "Rantai Semi-Markov" atau "Proses Semi-Markov."
sumber