menguji apakah rantai markov sama dengan yang teoritis

8

Saya sudah mendapat matriks hitung transisi empiris Q. Saya punya urutan teoritis pertama rantai Markov P. Katakan N adalah jumlah transisi. Saya ingin menguji apakah Q kompatibel dengan P. Apakah benar untuk menemukan matriks transisi hitungan teoretis (N * P) yang menghitung statistik chi-square, , dan kemudian menghitung nilai p dari dengan derajat kebebasan K * (K-1) ?i,jK(Qij(NPij))2NPijχ2K(K1)

Giorgio Spedicato
sumber
2
Saya tidak terlalu terbiasa dengan tes chi-square, tetapi membaca sekilas, tampaknya biasa digunakan untuk data multinomial (misalnya di sini ). Saya akan berpikir setiap baris P harus sesuai dengan distribusi multinomial? Jadi, Anda mungkin menggunakan ni untuk baris i , yaitu jumlah transisi "dari i ". Artinya, " N " dapat bervariasi tergantung pada kondisi awal?
GeoMatt22

Jawaban:

5

Dengan asumsi matriks Anda adalah sesuatu seperti

Pij=Pr[ji],Qij=t=1N[xt=i&xt+1=j]
maka Anda dapat menafsirkan setiap baris i sebagai distribusi multinomial dengan parameter
pi=Pi,:,ni=j=1KQij

Saya tidak yakin Anda dapat menyatukan semua baris, karena "jumlah uji coba" akan berbeda di setiap baris.

Misalnya katakanlah dan data Anda adalah . Jadi ada transisi, dengan berasal dari , tetapi dari dan hanya dan dari . Jadi saya rasa kepercayaan Anda pada umumnya harus lebih tinggi daripada kepercayaan Anda pada .K=3x=[1,1,2,1,2,3,1,2]N=7n1=4x=1n2=2x=2n3=1x=3p^1p^3

(Dalam kasus ekstrim, mungkin untuk contoh ini sebenarnya , tetapi Anda tidak memiliki data sama sekali pada transisi tersebut, karena Memperlakukan "tidak adanya bukti sebagai bukti absen" akan tampak bermasalah bagi saya di sini.)K4n4=0

Saya tidak terlalu terbiasa dengan tes chi-squared, tetapi ini menunjukkan Anda mungkin ingin memperlakukan baris secara mandiri (yaitu jumlah hanya lebih dari , dan gunakan daripada ). Alasan ini tampaknya tidak spesifik untuk uji chi-squared, jadi harus juga berlaku untuk tes signifikansi lain yang mungkin Anda gunakan (misalnya multinomial eksak ).jniN

Masalah utama adalah bahwa probabilitas transisi kondisional , sehingga untuk setiap entri matriks hanya transisi yang memenuhi prasyaratnya yang relevan. Memang, mungkin matriks transisi akan memenuhi , maka "matriks transisi empiris" harus .jPij=1P^ij=Qij/ni


Pembaruan: Menanggapi permintaan oleh OP, klarifikasi tentang "parameter pengujian".

Jika ada negara dalam rantai Markov, yaitu , maka untuk baris , distribusi multinomial yang sesuai akan memiliki vektor probabilitas dan jumlah percobaan , diberikan di atas.KPRK×KipiRKniN

Jadi akan ada kategori , dan vektor probabilitas akan memiliki derajat kebebasan , seperti . Jadi untuk baris statistik sesuai adalah yang akan secara asimptotik ikuti chi-squared yang didistribusikan dengan derajat kebebasan (seperti yang dinyatakan di sini dan di sini ). Lihat juga di sini untuk diskusi tentang kapan sesuai, dan tes alternatif yang mungkin lebih tepat.KpiK1j=1K(pi)j=1iχ2

χi2=j(QijniPij)2niPij
K1χ2

Ini mungkin menjadi mungkin untuk melakukan "test disamakan", dengan asumsi mengikuti distribusi chi-kuadrat dengan dof (yaitu penjumlahan dofs lebih baris). Namun saya tidak yakin apakah dapat dianggap independen. Dalam kasus apa pun, tes baris-bijaksana tampaknya lebih informatif, jadi mungkin lebih baik daripada tes yang disatukan.χP2=iχi2K(K1)χi2

GeoMatt22
sumber
Ide cerdas untuk memperlakukannya sebagai distribusi multinomial. Jumlah dari dua variabel Chi-kuadrat adalah chi-kuadrat sehingga statistik uji untuk setiap baris dapat komputer secara terpisah dan dijumlahkan bersama untuk menghasilkan statistik uji chi-kuadrat baru. Ini akan memiliki derajat kebebasanNK
Hugh
@Hugh saya tidak cukup akrab untuk mengevaluasi, tetapi ini bisa sangat masuk akal. Poin utama saya adalah lebih bahwa pendekatan "baris demi baris" tampaknya dapat dibenarkan, dan lebih informatif, daripada pendekatan "lumped". (Saya kira poin kedua adalah bahwa semua pekerjaan pada chi-square untuk multinomial, misalnya konvergensi asimptotik, bisa menjadi titik awal yang baik. Yang saya tahu tentang topik ini saya baru saja belajar dari membaca posting CV, jadi itu saja yang saya tahu. dapat menawarkan!) Anda dapat mempertimbangkan untuk memposting jawaban singkat yang membahas aspek chi-square lebih langsung.
GeoMatt22
@ GeoMatt22 ... Jadi apakah boleh saja jumlah derajat kebebasan untuk tes Chi-Square sama dengan menjadi N ukuran dtmc? N2N
Giorgio Spedicato
Giorgio, lihat pembaruan saya.
GeoMatt22
@Huh tolong lihat jawaban saya yang diperbarui. Perhatikan bahwa Wikipedia mengatakan "Perlu dicatat bahwa derajat kebebasan tidak didasarkan pada jumlah pengamatan". Saya tidak yakin apakah dof saya untuk "tes lumped" benar, tetapi juga tidak yakin dari mana dof Anda akan berasal! Ada klarifikasi? K(K1)NK
GeoMatt22