Mengingat dua rantai Markov menyerap, berapa probabilitas bahwa satu akan berakhir sebelum yang lain?

9

Saya memiliki dua rantai Markov yang berbeda, masing-masing dengan satu negara menyerap dan posisi awal yang diketahui. Saya ingin menentukan probabilitas bahwa rantai 1 akan mencapai kondisi menyerap dalam beberapa langkah lebih sedikit daripada rantai 2.

Saya pikir saya bisa menghitung probabilitas mencapai keadaan menyerap dalam rantai tertentu setelah n langkah: diberi matriks transisi P probabilitas diserap setelah langkah adalah mana adalah keadaan awal dan adalah negara menyerap.nPijnij

Saya tidak yakin ke mana harus pergi dari sini. Masalah analog yang pernah saya lihat melibatkan dadu (misalnya, menggulirkan jumlah 7 sebelum jumlah 8), tetapi itu lebih mudah untuk dipecahkan karena kemungkinan menggulirkan jumlah tertentu konstan dan independen dari jumlah langkah yang diambil sejauh ini.

Jeff
sumber

Jawaban:

13

Jalankan rantai secara paralel. Tentukan tiga kondisi menyerap dalam rantai produk yang dihasilkan:

  1. Rantai pertama mencapai kondisi menyerap tetapi yang kedua tidak.

  2. Rantai kedua mencapai kondisi menyerap tetapi yang pertama tidak.

  3. Kedua rantai secara bersamaan mencapai kondisi menyerap.

Probabilitas yang membatasi dari ketiga kondisi ini dalam rantai produk memberikan peluang menarik.


Solusi ini melibatkan beberapa konstruksi (sederhana). Seperti dalam pertanyaan, biarkan menjadi matriks transisi untuk rantai . Saat rantai dalam status ,P iP=Pij,1i,jnPi memberikan probabilitas transisi ke keadaan j . Keadaanmenyerapmembuat transisi ke dirinya sendiri dengan probabilitas 1 .Pijj1

  1. Keadaan apa pun yang dapat lakukan ketika mengganti baris P i = ( P i j , j = 1 , 2 , , n ) dengan vektor indikator ( 0 , 0 , , 0 , 1 , 0 , , 0 ) dengan 1 pada posisi i .iPi=(Pij,j=1,2,,n)(0,0,,0,1,0,,0)1i
  2. Setiap set menyerap negara dapat digabungkan dengan menciptakan sebuah rantai baru P / A yang negara adalah { iAP/A . Matriks transisi diberikan oleh{i|iA}{A}

    (P/A)ij={PijiA,jAkAPikiA,j=A0i=A,jA1i=j=A.

    Ini sama dengan menjumlahkan kolom sesuai dengan A dan mengganti baris yang sesuai dengan A dengan satu baris yang membuat transisi ke dirinya sendiri.PAA

  3. The produk dari dua rantai pada negara-negara S P dan Q pada negara-negara S Q , dengan transisi matriks P dan Q , masing-masing, adalah rantai Markov pada negara-negara S P × S Q = { ( p , q )PSPQSQPQ dengan matriks transisiSP×SQ={(p,q)|pSP,qSQ}

    (PQ)(i,j),(k,l)=PikQjl.

    Akibatnya, rantai produk menjalankan dua rantai secara paralel, secara terpisah melacak di mana masing-masing, dan membuat transisi secara mandiri.


Contoh sederhana dapat memperjelas konstruksi ini. Misalkan Polly adalah membalik koin dengan kesempatan kepala mendarat. Dia berencana untuk melakukannya sampai mengamati kepala. Status untuk proses membalik koin adalah S P = { T , H } yang mewakili hasil flip terbaru: T untuk ekor, H untuk kepala. Dengan berencana berhenti di kepala, Polly akan menerapkan konstruksi pertama dengan menjadikan H sebagai negara penyerap. Matriks transisi yang dihasilkan adalahpSP={T,H}THH

P=(1pp01).

Itu dimulai dalam keadaan acak diberikan oleh lemparan pertama.(1p,p)

Seiring dengan Polly, Quincy akan melemparkan koin yang adil. Dia berencana untuk berhenti begitu dia melihat dua kepala berturut-turut. Rantai Markov-nya harus melacak hasil sebelumnya serta hasil saat ini. Ada empat kombinasi dua kepala dan dua ekor, yang saya akan menyingkat " ", misalnya, di mana huruf pertama adalah hasil sebelumnya dan huruf kedua adalah hasil saat ini . Quincy menerapkan konstruksi (1) untuk menjadikan HH sebagai negara penyerap. Setelah melakukan itu, ia menyadari bahwa ia tidak benar-benar membutuhkan empat keadaan: ia dapat menyederhanakan rantai ke tiga keadaan: T berarti hasil saat ini adalah ekor, H berarti hasil saat ini adalah kepala, dan XTHHHTHXberarti dua hasil terakhir sama-sama kepala - ini adalah negara menyerap. Matriks transisi adalah

Q=(1212012012001).

Rantai produk berjalan di enam negara: . Matriks transisi adalah produk tensor dari P dan Q dan dengan mudah dihitung. Misalnya, ( PQ ) ( T ,(T,T),(T,H),(T,X);(H,T),(H,H),(H,X)PQ adalah kesempatan yang Polly membuat transisi dariTkeTdan, pada saat yang sama (dan mandiri), Quincy membuat transisi dariTkeH. Mantan memiliki kesempatan1-pdan kesempatan kedua1 / 2. Karena rantai dijalankan secara independen, peluang itu berlipat ganda, memberi(1-p) / 2. Matriks transisi penuh adalah(PQ)(T,T),(T,H)TTTH1p1/2(1p)/2

PQ=(1p21p20p2p201p201p2p20p2001p00p0001212000012012000001).

Itu dalam bentuk matriks blok dengan blok yang sesuai dengan matriks kedua :Q

PQ=(P11QP12QP21QP22Q)=((1p)QpQ0Q).

Polly dan Quincy bersaing untuk melihat siapa yang akan mencapai tujuan mereka terlebih dahulu. Pemenang akan Polly setiap kali transisi pertama kali dilakukan ke mana * tidak X ; pemenangnya adalah Quincy setiap kali transisi pertama kali dilakukan ke ( T , X ) ; dan jika sebelum salah satu dari itu bisa terjadi transisi dibuat ke ( H , X ) , hasilnya akan menjadi seri. Untuk melacak, kami akan membuat status ( H , T ) dan ( H , H )(H,*)*X(T,X)(H,X)(H,T)(H,H)keduanya menyerap (melalui konstruksi (1)) dan kemudian menggabungkannya (melalui konstruksi (2)). Matriks transisi yang dihasilkan, diurutkan oleh state adalah(T,T),(T,H),(T,X),{(H,T),(H,H)},(H,X)

R=(1p21p20p01p201p2p2p2001000001000001).

(T,T),(T,H),(T,X),{(H,T),(H,H)},(H,X)μ=((1p)/2,(1p)/2,0,p,0)

n

μRn11+4pp2(0,0,(1p)2,p(5p),p(1p)).

(T,X),{(H,T),(H,H)},(H,X)(1p)2:p(5p):p(1p)

Angka

p

whuber
sumber
1
Contoh yang sangat rapi, terima kasih untuk ini. Saya masih mengerjakan detail untuk melihatnya sendiri. Hanya sebuah pertanyaan: di sini kita mengasumsikan dua peristiwa (lemparan Polly dan Quincy) terjadi secara bersamaan, berapa banyak perbedaan yang akan terjadi jika kita membuatnya secara berurutan, atau bahkan memilih secara acak setiap kali siapa yang akan melempar berikutnya?
user929304
1
@ user929304 Anda akan mendapatkan jawaban yang berbeda, mungkin secara substansial demikian. Sebagai contoh, misalkan P dan Q menjalankan rantai di mana negara-negara dipartisi menjadi himpunan bagian A dan B di mana semua transisi dari A pergi ke B dan semua dari B pergi ke A. Biarkan P dan Q keduanya dimulai pada negara di A. In rantai produk mereka berdua secara bersamaan bergantian antara A dan B, tetapi rantai pilihan berurutan dan acak mematahkan pola invarian tersebut.
whuber