Saya sudah mendapat matriks hitung transisi empiris Q. Saya punya urutan teoritis pertama rantai Markov P. Katakan N adalah jumlah transisi. Saya ingin menguji apakah Q kompatibel dengan P. Apakah benar untuk menemukan matriks transisi hitungan teoretis (N * P) yang menghitung statistik chi-square, , dan kemudian menghitung nilai p dari dengan derajat kebebasan K * (K-1) ?
hypothesis-testing
chi-squared
markov-process
Giorgio Spedicato
sumber
sumber
Jawaban:
Dengan asumsi matriks Anda adalah sesuatu seperti
Saya tidak yakin Anda dapat menyatukan semua baris, karena "jumlah uji coba" akan berbeda di setiap baris.
Misalnya katakanlah dan data Anda adalah . Jadi ada transisi, dengan berasal dari , tetapi dari dan hanya dan dari . Jadi saya rasa kepercayaan Anda pada umumnya harus lebih tinggi daripada kepercayaan Anda pada .K=3 x=[1,1,2,1,2,3,1,2] N=7 n1=4 x=1 n2=2 x=2 n3=1 x=3 p^1 p^3
(Dalam kasus ekstrim, mungkin untuk contoh ini sebenarnya , tetapi Anda tidak memiliki data sama sekali pada transisi tersebut, karena Memperlakukan "tidak adanya bukti sebagai bukti absen" akan tampak bermasalah bagi saya di sini.)K 4 n4=0
Saya tidak terlalu terbiasa dengan tes chi-squared, tetapi ini menunjukkan Anda mungkin ingin memperlakukan baris secara mandiri (yaitu jumlah hanya lebih dari , dan gunakan daripada ). Alasan ini tampaknya tidak spesifik untuk uji chi-squared, jadi harus juga berlaku untuk tes signifikansi lain yang mungkin Anda gunakan (misalnya multinomial eksak ).j ni N
Masalah utama adalah bahwa probabilitas transisi kondisional , sehingga untuk setiap entri matriks hanya transisi yang memenuhi prasyaratnya yang relevan. Memang, mungkin matriks transisi akan memenuhi , maka "matriks transisi empiris" harus .∑jPij=1 P^ij=Qij/ni
Pembaruan: Menanggapi permintaan oleh OP, klarifikasi tentang "parameter pengujian".
Jika ada negara dalam rantai Markov, yaitu , maka untuk baris , distribusi multinomial yang sesuai akan memiliki vektor probabilitas dan jumlah percobaan , diberikan di atas.K P∈RK×K i pi∈RK ni∈N
Jadi akan ada kategori , dan vektor probabilitas akan memiliki derajat kebebasan , seperti . Jadi untuk baris statistik sesuai adalah yang akan secara asimptotik ikuti chi-squared yang didistribusikan dengan derajat kebebasan (seperti yang dinyatakan di sini dan di sini ). Lihat juga di sini untuk diskusi tentang kapan sesuai, dan tes alternatif yang mungkin lebih tepat.K pi K−1 ∑Kj=1(pi)j=1 i χ2
Ini mungkin menjadi mungkin untuk melakukan "test disamakan", dengan asumsi mengikuti distribusi chi-kuadrat dengan dof (yaitu penjumlahan dofs lebih baris). Namun saya tidak yakin apakah dapat dianggap independen. Dalam kasus apa pun, tes baris-bijaksana tampaknya lebih informatif, jadi mungkin lebih baik daripada tes yang disatukan.χ2P=∑iχ2i K(K−1) χ2i
sumber