Bagaimana memodelkan koin bias dengan waktu yang bervariasi?

10

Model koin bias biasanya memiliki satu parameter . Salah satu cara untuk memperkirakan dari serangkaian undian adalah dengan menggunakan beta sebelum dan menghitung distribusi posterior dengan kemungkinan binomial.θ=P(Head|θ)θ

Dalam pengaturan saya, karena beberapa proses fisik yang aneh, sifat koin saya perlahan berubah dan menjadi fungsi waktu . Data saya adalah serangkaian undian berurutan yaitu . Saya dapat mempertimbangkan bahwa saya hanya memiliki satu gambar untuk setiap pada kisi waktu diskrit dan reguler.θt{H,T,H,H,H,T,...}t

Bagaimana Anda membuat model ini? Saya sedang memikirkan sesuatu seperti filter Kalman yang disesuaikan dengan fakta bahwa variabel tersembunyi adalah dan menjaga kemungkinan binomial. Apa yang bisa saya gunakan untuk memodelkan untuk menjaga agar inferensi tetap bagus?θP(θ(t+1)|θ(t))

Edit jawaban berikut (terima kasih!) : Saya ingin memodelkan sebagai Rantai Markov pesanan 1 seperti yang dilakukan di filter HMM atau Kalman. Satu-satunya asumsi yang dapat saya buat adalah bahwa halus. Saya bisa menulis dengan noise Gaussian kecil (ide filter Kalman), tetapi ini akan melanggar persyaratan bahwa harus tetap dalam . Mengikuti ide dari @J Dav, saya bisa menggunakan fungsi probit untuk memetakan garis nyata ke , tetapi saya memiliki intuisi bahwa ini akan memberikan solusi non-analitis. Distribusi beta dengan meanθ(t)θ(t)P(θ(t+1)|θ(t))=θ(t)+ϵϵθ[0,1][0,1]θ(t) dan varians yang lebih luas bisa melakukan trik.

Saya mengajukan pertanyaan ini karena saya merasa bahwa masalah ini sangat sederhana sehingga harus dipelajari sebelumnya.

repied2
sumber
Anda bisa mendapatkan perkiraan jika Anda memiliki model untuk bagaimana proporsi keberhasilan berubah seiring waktu. Banyak model yang berbeda akan bekerja dan perkiraannya bisa sangat bervariasi berdasarkan model yang diasumsikan. Saya tidak berpikir traktabilitas adalah kriteria praktis untuk memilih model. Saya ingin memahami prosesnya dan mencari model yang menunjukkan karakteristik yang sesuai dengan perilaku yang Anda harapkan.
Michael R. Chernick
@MichaelChernick: Terima kasih. Satu-satunya asumsi yang bisa saya buat adalah bahwa bergerak dengan lancar dan perlahan. Selain itu, keterlacakan merupakan kriteria penting karena saya sebenarnya ingin memperluas solusi untuk kasus multivarian dengan saling ketergantungan non-sepele. Solusi ideal akan bersifat analitis dan memberikan pembaruan estimasi parameter 'online' saat data baru tiba. θ
repied2
1
Dapatkah Anda mengukur apa yang Anda maksud dengan " bergerak dengan lancar dan perlahan?" Bilangan bulat adalah diskrit, dan ada fungsi halus yang mengambil nilai arbitrer pada bilangan bulat, yang berarti bahwa kelancaran tidak memberikan kendala. Beberapa gagasan "perlahan" masih tidak memberikan kendala, sementara beberapa orang berpendapat demikian. θ
Douglas Zare
Seberapa cepat "lambat", seperti perubahan probabilitas 0,1 / satuan waktu atau 0,001 atau ... Dan berapa lama urutan yang Anda harapkan? Apakah kisarannya relatif sempit (mis. 0,2 - 0,4) atau mendekati (0,1)?
jbowman
@DouglasZare Dengan 'smooth', saya ingin menyatakan bahwa E [θ_t + 1 | θ_t] = θ_t (atau sangat dekat) dan VAR (θ_t + 1 | θ_t) kecil. θ tidak melompat-lompat (kalau tidak, tidak ada yang bisa dilakukan benar-benar).
repied2

Jawaban:

2

Saya ragu Anda dapat datang dengan model dengan solusi analitik, tetapi kesimpulannya masih dapat dibuat traktat menggunakan alat yang tepat karena struktur ketergantungan model Anda sederhana. Sebagai peneliti pembelajaran mesin, saya lebih suka menggunakan model berikut karena kesimpulan dapat dibuat cukup efisien menggunakan teknik Propagasi Harapan:

Biarkan menjadi hasil dari uji coba -th. Mari kita tentukan parameter yang bervariasi waktuX(t)t

η(t+1)N(η(t),τ2) untuk .t0

Untuk menautkan dengan , perkenalkan variabel latenη(t)X(t)

Y(t)N(η(t),β2) ,

dan model menjadiX(t)

X(t)=1 jika , dan sebaliknya. Anda benar-benar dapat mengabaikan dan memarginalkannya hanya dengan mengatakan , (dengan cdf of standar normal) tetapi pengenalan variabel laten membuat inferensi mudah. Juga, perhatikan bahwa dalam parametrization asli Anda .Y(t)0X(t)=0Y(t)P[X(t)=1]=Φ(η(t)/β)Φθ(t)=η(t)/β

Jika Anda tertarik menerapkan algoritma inferensi, lihat makalah ini . Mereka menggunakan model yang sangat mirip sehingga Anda dapat dengan mudah mengadaptasi algoritma. Untuk memahami EP, halaman berikut mungkin bermanfaat. Jika Anda tertarik untuk melakukan pendekatan ini, beri tahu saya; Saya dapat memberikan saran yang lebih terperinci tentang bagaimana menerapkan algoritma inferensi.

d_ijk_stra
sumber
0

Untuk menguraikan komentar saya, model seperti p (t) = p exp (-t) adalah model yang sederhana dan memungkinkan estimasi p (t) dengan memperkirakan p menggunakan estimasi kemungkinan maksimum. Tetapi apakah probabilitas benar-benar membusuk secara eksponensial. Model ini akan jelas salah jika Anda mengamati periode waktu dengan frekuensi keberhasilan tinggi daripada yang Anda amati pada waktu sebelumnya dan kemudian. Perilaku osilasi dapat dimodelkan sebagai p (t) = p | sint |. Kedua model sangat mudah ditelusuri dan dapat diselesaikan dengan kemungkinan maksimum tetapi mereka memberikan solusi yang sangat berbeda.000

Michael R. Chernick
sumber
1
Tampaknya OP mencari untuk memodelkan probabilitas keberhasilan pada waktu , , sebagai proses markovian, bukan untuk menentukan beberapa bentuk fungsional untuk . tθ(t)θ(t)
Makro
1
@ Macro benar, saya tidak dapat memberikan bentuk parametrik untuk , dan ini tidak diinginkan karena fungsi ini bisa menjadi sesuatu yang lancar. Saya ingin model Markov urutan 1 mirip dengan Model Markov Tersembunyi atau filter Kalman, tetapi dengan variabel tersembunyi yang mengambil nilai nyata antara 0 dan 1, dan dengan kemungkinan Bernouilli. theta(t)
repied2
@pierre Oke sebelum edit, tampak bahwa Anda mencari untuk memperkirakan p waktu yang bervariasi dan hanya menyarankan HMM sebagai pendekatan yang mungkin. Saya tidak merekomendasikan bentuk fungsional untuk perubahannya dengan t. Saya menekankan bahwa tanpa informasi lebih lanjut banyak model dari berbagai jenis dapat dibangun dan dua contoh saya menunjukkan bahwa tanpa informasi model selanjutnya pilihan dapat memberikan jawaban yang sangat berbeda. Mengapa Anda bersikeras pada HMM? Jika seseorang bekerja dan cocok dengan data Anda mengapa menolaknya karena ini "non-analitis.
Michael R. Chernick
Saya menyarankan agar mencari solusi yang mudah bukanlah cara untuk memecahkan masalah statistik praktis!
Michael R. Chernick
1
@MichaelChernick Terakhir: Saya ingin menemukan solusi analitis karena saya harap ini adalah masalah yang terkenal dan orang-orang mengusulkan solusi analitik yang cukup fleksibel. Tetapi saya setuju dengan saran kami bahwa pemodelan 'dinamika nyata' lebih penting daripada biaya komputasi secara umum. Sayangnya ini untuk data besar dan algo lambat tidak akan berguna :-(
repied2
0

Peluang Anda berubah dengan tetapi seperti kata Michael, Anda tidak tahu caranya. linear atau tidak? Sepertinya masalah pemilihan model di mana kemungkinan Anda :tp

p=Φ(g(t,θ)) dapat bergantung pada fungsi sangat tidak linier . hanyalah fungsi pembatas yang menjamin probabilitas antara 0 dan 1.g(t,θ)Φ

Pendekatan eksplorasi yang sederhana adalah dengan mencoba beberapa kemungkinan untuk dengan berbagai non linier dan untuk melakukan pemilihan model berdasarkan Kriteria Informasi standar.Φg()g()

Untuk menjawab pertanyaan Anda yang diedit ulang :

Seperti yang Anda katakan menggunakan probit akan menyiratkan solusi numerik saja tetapi Anda dapat menggunakan fungsi logistik sebagai gantinya:

Fungsi logistik:P[θ(t+1)]=11+exp(θ(t)+ϵ)

Diniarisasi oleh:logP1P=θ(t)+ϵ

Saya tidak yakin bagaimana ini bisa bekerja di bawah pendekatan filter Kalman, tetapi masih percaya bahwa spesifikasi non linear seperti atau banyak lainnya tanpa istilah acak akan lakukan pekerjaan. Seperti yang Anda lihat fungsi ini adalah "smoth" dalam arti bahwa itu kontinu dan dapat dibedakan. Sayangnya menambahkan akan menghasilkan lompatan dari probabilitas yang dihasilkan yang merupakan sesuatu yang tidak Anda inginkan sehingga saran saya adalah untuk mengeluarkan .ϵ ϵθ(t+1)=at3+bt2+ct+dϵϵ

:P[Coint+1=H|t]=11+exp(θ(t))

Anda sudah memiliki pengacakan di acara bernoulli (Markov Chain) dan Anda menambahkan sumber tambahan karena . Dengan demikian, masalah Anda dapat diselesaikan sebagai Probit atau Logit yang diperkirakan dengan Kemungkinan maksimum dengan sebagai variabel penjelas. Saya kira Anda setuju bahwa kekikiran itu sangat penting. Kecuali jika tujuan utama Anda adalah menerapkan metode yang diberikan (HMM dan Kalman Filter) dan tidak memberikan solusi valid yang paling sederhana untuk masalah Anda.tϵt

JDav
sumber
Jika Anda menggunakan probit, ekstensi multivarian langsung karena estimasi multivarian dapat diperkirakan. Ketergantungan akan tersirat oleh matriks kovarians dari distribusi normal multivariat tersirat.
JDav