Saya menduga bahwa serangkaian urutan yang diamati adalah rantai Markov ...
X=⎛⎝⎜⎜⎜⎜AB⋮BCA⋮CDA⋮ADC⋮DBA⋮AAD⋮BCA⋮E⎞⎠⎟⎟⎟⎟
Namun bagaimana saya bisa mengecek bahwa mereka benar-benar menghargai properti tanpa memori
P(Xi=xi|Xj=xj)?
Atau paling tidak membuktikan bahwa mereka adalah Markov di alam? Perhatikan ini adalah urutan yang diamati secara empiris. Adakah pikiran?
EDIT
Hanya untuk menambahkan, tujuannya adalah untuk membandingkan serangkaian urutan yang diprediksi dari yang diamati. Jadi kami sangat menghargai komentar tentang bagaimana cara terbaik untuk membandingkan ini.
Matriks Transisi Pesanan Pertama Mij=xij∑mxik
mana m = A..E menyatakan
M=⎛⎝⎜⎜⎜⎜⎜⎜0.18340.46970.18270.23780.24580.30770.11360.24040.18180.17880.07690.00760.22120.06290.11730.14790.25000.19230.33570.17880.28400.15910.16350.18180.2793⎞⎠⎟⎟⎟⎟⎟⎟
Nilai eigen dari M
E=⎛⎝⎜⎜⎜⎜⎜⎜1.000000000−0.2283000000.1344000000.1136−0.0430i000000.1136+0.0430i⎞⎠⎟⎟⎟⎟⎟⎟
Vektor eigen dari M
V=⎛⎝⎜⎜⎜⎜⎜⎜0.44720.44720.44720.44720.4472−0.58520.7838−0.2006−0.00100.0540−0.4219−0.42110.37250.70890.0589−0.2343−0.0421i−0.4479−0.2723i0.63230.2123−0.0908i0.2546+0.3881i−0.2343+0.0421i−0.4479+0.2723i0.63230.2123+0.0908i0.2546−0.3881i⎞⎠⎟⎟⎟⎟⎟⎟
Jawaban:
Saya ingin tahu apakah yang berikut akan memberikan tes Pearson valid untuk proporsi sebagai berikut.χ2
Hal ini menggoda bagi saya untuk berpikir bahwa setiap , sehingga total T ~ χ 2 12 . Namun, saya tidak sepenuhnya yakin akan hal itu, dan akan menghargai pemikiran Anda tentang ini. Saya tidak juga tidak co sertain tentang apakah salah satu kebutuhan untuk menjadi paranoid tentang kemerdekaan, dan ingin membagi sampel di bagian untuk memperkirakan p dan ˉ p .TU∼χ23 T∼χ212 p^ p¯
sumber
Properti Markov mungkin sulit untuk diuji secara langsung. Tetapi mungkin cukup untuk mencocokkan model yang mengasumsikan properti Markov dan kemudian menguji apakah model itu berlaku. Mungkin ternyata model yang cocok adalah pendekatan yang baik yang berguna untuk Anda dalam praktik, dan Anda tidak perlu khawatir apakah properti Markov benar-benar dimiliki atau tidak.
Paralel dapat ditarik ke regresi linier. Praktik yang biasa bukan untuk menguji apakah linearitas berlaku, tetapi apakah model linier adalah pendekatan yang berguna.
sumber
Untuk mengkonkretkan saran dari jawaban sebelumnya, Anda pertama-tama ingin memperkirakan probabilitas Markov - dengan asumsi itu Markov. Lihat balasannya di sini Memperkirakan Kemungkinan Rantai Markov
Anda harus mendapatkan 4 x 4 matriks berdasarkan proporsi transisi dari negara A ke A, A ke B, dll Panggil matriks ini . M 2 kemudian harus menjadi matriks transisi dua langkah: A ke A dalam 2 langkah, dan seterusnya. Anda kemudian dapat menguji apakah matriks transisi 2 langkah yang diamati Anda mirip dengan M 2 .M M2 M2
Karena Anda memiliki banyak data untuk jumlah status, Anda dapat memperkirakan dari satu setengah data dan menguji M 2 menggunakan setengah lainnya - Anda menguji frekuensi yang diamati terhadap probabilitas teoritis multinomial. Itu seharusnya memberi Anda gambaran tentang seberapa jauh Anda.M M2
Kemungkinan lain adalah untuk melihat apakah proporsi kondisi dasar: proporsi waktu yang dihabiskan dalam A, waktu yang dihabiskan dalam B, cocok dengan vektor eigen dari nilai eigen unit M. Jika seri Anda telah mencapai semacam kondisi mapan, proporsi waktu di masing-masing negara harus cenderung ke batas itu.
sumber
Di luar Markov Property (MP), properti lebih lanjut Waktu Homogenitas (TH): dapat Markov tetapi dengan matriks transisi P ( t ) tergantung pada waktu t . Misalnya, mungkin tergantung pada hari kerja di t jika pengamatan harian, dan kemudian ketergantungan X t pada X t - 7 syarat X t - 1 dapat didiagnosis jika TH adalah terlalu diasumsikan.Xt P(t) t t Xt Xt−7 Xt−1
Dengan asumsi TH memegang, cek mungkin bagi MP adalah pengujian yang independen dari X t - 2 tergantung pada X t - 1 , sebagai Michael Chernick dan StasK disarankan. Ini dapat dilakukan dengan menggunakan tes untuk tabel kontingensi. Kita dapat membangun n tabel kontingensi X t dan X t - 2 bersyarat pada { X t - 1 = x j } untuk n kemungkinan nilai x jXt Xt−2 Xt−1 n Xt Xt−2 {Xt−1=xj} n xj , dan menguji independensi. Ini juga dapat dilakukan dengan menggunakan
dengan ℓ > 1 sebagai pengganti X t - 2 .Xt−ℓ ℓ>1 Xt−2
Dalam R, kontingensi tabel atau array mudah diproduksi berkat faktor fasilitas dan fungsip(Xt|Xt−1=xj,Xt−2=xi) i j sebagai indeks kolom dalam terali harus di bawah MP mengarah ke distribusi serupa dalam kolom.
apply
,sweep
. Gagasan di atas juga dapat dieksploitasi secara grafis. Paket ggplot2 atau kisi dengan mudah menyediakan plot bersyarat untuk membandingkan distribusi kondisional . Misalnya pengaturan saya sebagai indeks baris dan jChap. 5 buku Analisis statistik proses stokastik dalam waktu oleh JK Lindsey berisi ide-ide lain untuk memeriksa asumsi.
]
sumber
Saya pikir placida dan mpikta telah memberikan pendekatan yang sangat bijaksana dan sangat baik.
Maka statistik uji akan menjadi perbedaan antara estimasi proporsi ini. Komplikasi untuk perbandingan standar dari urutan Bernoulli adalah bahwa mereka berkorelasi. Tetapi Anda bisa melakukan tes bootstrap proporsi binomial dalam kasus ini.
Kemungkinan lainnya adalah membangun dua dua tabel dari dua tahap dan tiga tahap hasil berpasangan di mana0 adalah kegagalan dan 1 sukses dan frekuensi sel dihitung untuk pasangan ( 0 , 0 ) , ( 0 , 1 ) , ( 1 , 0 ) dan ( 1 , 1 ) di mana komponen pertama adalah hasil dua tahap dan yang kedua adalah hasil tiga tahap yang sesuai. Anda kemudian dapat menerapkan tes McNemar ke tabel.
sumber
You could bin the data into evenly spaced intervals, then compute the unbiased sample variances of subsets{Xn+1:Xn=x1,Xn−k=x2} . By the law of total variance,
The LHS, if it is almost zero, provides evidence that the transition probabilities do not depend onXn−k , though it is clearly a weaker statement: e.g., let Xn+1∼N(Xn,Xn−1) . Taking the expected value of both sides of the above equation, the RHS can be computed from the sample variances (i.e., replacing expected values with averages). If the expected value of the variance is zero then the variance is 0 almost always.
sumber