Deteksi changepoint online Bayesian (distribusi prediksi marjinal)

9

Saya membaca kertas pendeteksian changepoint online Bayesian oleh Adams dan MacKay ( tautan ).

Penulis mulai dengan menulis distribusi prediksi marjinal: mana

P(xt+1|x1:t)=rtP(xt+1|rt,xt(r))P(rt|x1:t)(1)
  • txt adalah pengamatan pada waktu ;t
  • tx1:t menunjukkan set pengamatan sampai waktu ;t
  • rtN adalah runlength saat ini (waktu sejak titik perubahan terakhir, bisa 0); dan
  • r txt(r) adalah himpunan pengamatan yang terkait dengan run .rt

Eq. 1 secara resmi benar (lihat jawaban di bawah oleh @JuhoKokkala), tetapi pemahaman saya adalah bahwa jika Anda ingin benar-benar membuat prediksi tentang Anda harus mengembangkannya sebagai berikut:xt+1

P(xt+1|x1:t)=rt,rt+1P(xt+1|rt+1,xt(r))P(rt|x1:t)P(rt+1|rt)(1b)

Alasan saya adalah bahwa mungkin ada changepoint pada (masa depan) waktu , tetapi posterior hanya mencakup sampai .P ( r t | x 1 : t ) tt+1P(rt|x1:t)t

Intinya adalah, penulis dalam makalah ini membuat kita dari Persamaan. 1 sebagaimana adanya (lihat Persamaan. 3 dan 11 di koran), dan bukan 1b. Jadi, mereka tampaknya mengabaikan kemungkinan titik perubahan pada waktu saat memprediksi dari data yang tersedia pada waktu . Pada awal Bagian 2 mereka mengatakan en passantx t + 1 tt+1xt+1t

Kami berasumsi bahwa kami dapat menghitung distribusi prediktif [untuk ] bersyarat pada panjang run yang diberikan . r txt+1rt

yang barangkali di mana masalahnya. Tetapi secara umum, distribusi prediktif ini akan terlihat seperti Persamaan. 1b; yang bukan apa yang mereka lakukan (Persamaan. 11).

Jadi, saya tidak yakin saya mengerti apa yang sedang terjadi. Mungkin ada sesuatu yang lucu terjadi dengan notasi.


Referensi

  • Adams, RP, & MacKay, DJ (2007). Deteksi changepoint online Bayesian. arXiv preprint arXiv: 0710.3742.
Lacerbi
sumber
Penjelasan potensial adalah bahwa mewakili panjang run pada akhir waktu langkah , yang setelah titik perubahan pada waktu . Dengan ini, Persamaan. Saya masuk akal. Bahkan, salah satu inisialisasi dari algoritma adalah dengan menetapkan yang mengasumsikan bahwa ada changepoint tepat sebelum mulai pada . Namun, Gambar 1 salah (atau setidaknya menyesatkan) dalam hal itu jika ada titik temu antara dan , dan antara dan seperti yang digambarkan pada Gambar 1a, maka dan t t P ( r 0 = 0 ) = 1 t = 1 t = 4 t = 5 t = 10 t = 11 r 4 r 10 r 5 r 11 11rtttP(r0=0)=1t=1t=4t=5t=10t=11r4r10harus 0 menurut notasi ini, dan bukan dan sesuai Gambar 1b. r5r11
lacerbi
1
Ada sesuatu yang aneh terjadi dalam Persamaan. 3 sebagai faktor tengah dalam ringkasan di baris terakhir adalah sementara saya pikir berisi . Saya menduga dan telah beralih tempat karena akan masuk akal. Dalam Persamaan. 11, sisi kanan tampaknya bergantung pada yang tidak muncul di sisi kiri sama sekali, jadi ada sesuatu yang salah atau saya tidak mengerti notasi sama sekali. x ( r ) t x t tP(xtrt1,xt(r))xt(r)xttP ( x tr t , x ( r ) t - 1 ) x ( r ) tt1P(xtrt,xt1(r))xt(r)
Juho Kokkala
@JuhoKokkala: Saya senang saya bukan satu-satunya dengan perasaan itu ...
lacerbi
1
@ lacerbi, saya punya pertanyaan lain tentang makalah ini, dan saya pikir Anda mungkin bisa menjawabnya karena Anda sepertinya terbiasa dengan pekerjaan ini: stats.stackexchange.com/questions/419988 .
gwg

Jawaban:

5

Keduanya (1) dan (1b) benar. OP benar bahwa (dalam model ini) mungkin ada changepoint pada , dan tergantung pada apakah ada changepoint. Ini tidak menyiratkan masalah dengan (1) karena nilai yang mungkin dari sepenuhnya "ditutupi" oleh . berarti distribusi bersyarat dari bersyarat pada . Distribusi bersyarat ini rata-rata di atas "segalanya", termasuk , bersyarat pada . Sama seperti orang dapat menulis, katakanlah,t+1xt+1rt+1P(xt+1rt,x1:t)P(xt+1|rt,x1:t)xt+1(rt,x1:t)rt+1(rt,x1:t)P(xt+1000|xt), yang akan memperhitungkan semua kemungkinan konfigurasi changepoint serta nilai yang terjadi antara dan .xitt+1000

Dalam sisanya, saya pertama kali menurunkan (1) dan kemudian (1b) berdasarkan pada (1).

Derivasi (1)

Untuk variabel acak , kita memiliki selama adalah diskrit (kalau tidak jumlahnya perlu diganti dengan integral). Menerapkan ini ke :A,B,C

P(AB)=cP(AB,C=c)P(C=cB),
Cxt+1,x1:t,rt

P(xt+1x1:t)=rtP(xt+1rt,x1:t)P(rtx1:t),
yang memegang tidak peduli apa pun dependensi antara , , adalah, yaitu, tidak ada asumsi model yang belum telah digunakan. Dalam model ini, diberikan diasumsikan * tidak tergantung secara kondisional dari nilai dari run sebelum . Ini menyiratkan . Mengganti ini ke dalam persamaan sebelumnya, kita dapatkanrtx1:txt+1xt+1rt,xt(r)xxt(r)P(xt+1rt,x1:t)=P(xt+1rt,xt(r))

P(xt+1x1:t)=rtP(xt+1rt,xt(r))P(rtx1:t),(1)
yang (1) di OP.

Penurunan dari (1b)

Mari kita pertimbangkan dekomposisi atas nilai yang mungkin dari : P(xt+1rt,xt(r))rt+1

P(xt+1rt,xt(r))=rt+1P(xt+1rt+1,rt,xt(r))P(rt+1rt,xt(r)).

Karena diasumsikan * bahwa apakah suatu changepoint terjadi pada (antara dan ) tidak bergantung pada sejarah , kita memiliki . Lebih lanjut, karena menentukan apakah termasuk dalam run yang sama dengan , kita memiliki . Mengganti dua penyederhanaan ini menjadi faktorisasi di atas, kita mendapatkan t+1xtxt+1xP(rt+1rt,xt(r))=P(rt+1rt)rt+1xt+1xtP(xt+1rt+1,rt,xt(r))=P(xt+1rt+1,xt(r))

P(xt+1rt,xt(r))=rt+1P(xt+1rt+1,xt(r))P(rt+1rt).
Mengganti ini menjadi (1), kita mendapatkan yang merupakan OP (1b).
P(xt+1x1:t)=rt(rt+1P(xt+1rt+1,xt(r))P(rt+1rt))P(rtx1:t),(1b)

* Komentar tentang asumsi independensi bersyarat model

Berdasarkan penelusuran cepat pada kertas, saya pribadi ingin properti independensi bersyarat untuk lebih eksplisit dinyatakan di suatu tempat, tapi saya kira maksudnya adalah bahwa adalah Markovian dan : s terkait dengan berbagai berjalan independen (diberikan berjalan).xrx

Juho Kokkala
sumber
1
(+1) Terima kasih. Yap, tentu saja, saya mengerti Persamaan itu. 1 secara formal benar jika seseorang mengasumsikan marginalisasi implisit atas . Masalahnya adalah bahwa kemudian penulis membuat prediksi (Persamaan. 11 di koran, dan secara implisit dalam Persamaan. 3) dan mereka tampaknya tidak meminggirkan ketika mereka mengambilnya. r t + 1rt+1rt+1
lacerbi
1
Oh Tampaknya kemudian saya salah mengerti pertanyaan - haruskah saya menghapus ini? Anda mungkin ingin mengklarifikasi pertanyaan, saat ini kedengarannya seperti (1) entah bagaimana salah (bukannya mungkin tidak berguna)
Juho Kokkala
Harap simpan jawaban ini, yang sangat berharga. Kesalahan saya bahwa saya tidak cukup jelas dalam posting asli saya. Saya mencoba mengklarifikasi pertanyaan saya berkat komentar Anda, dan dengan cara yang masih membuat jawaban ini bermakna.
lacerbi