Beralih dari Memodelkan Proses menggunakan Distribusi Poisson untuk menggunakan Distribusi Binomial Negatif?

$\newcommand{\P}{\mathbb{P}}$ Kami memiliki proses acak yang mungkin-atau-mungkin-tidak terjadi beberapa kali dalam jangka waktu $T$ . Kami memiliki umpan data dari model yang sudah ada dari proses ini, yang menyediakan probabilitas sejumlah peristiwa yang terjadi pada periode $0 \leq t < T$ . Model yang ada ini sudah tua dan kita perlu menjalankan cek langsung pada data umpan untuk kesalahan estimasi. Model lama yang menghasilkan data-feed (yang menyediakan kemungkinan $n$ peristiwa yang terjadi dalam waktu- tersisa $t$ ) adalah sekitar Poisson Distributed.

Jadi untuk memeriksa anomali / kesalahan, kita membiarkan $t$ menjadi waktu yang tersisa dan $X_t$ menjadi jumlah total kejadian yang terjadi di sisa waktu $t$ . Model lama menyiratkan estimasi $\P(X_t \leq c)$ . Jadi dengan asumsi kami $X_t\sim \operatorname{Poisson}(\lambda_{t})$ kita memiliki:

P (X_{t} \leq c) = e^{- λ} \sum_{k = 0}^{c} \frac{λ_{t}^{k}}{k!} .

$\P(X_t \leq c) = e^{-\lambda}\sum_{k=0}^c\frac{\lambda_t^k}{k!}\,.$ Untuk menurunkan laju acara kami

λ_{t}

$\lambda_t$ dari output model lama (pengamatan

y_{t}

$y_{t}$ ), kami menggunakan pendekatan ruang keadaan dan memodelkan hubungan keadaan sebagai:

y_{t} = λ_{t} + ε_{t} (ε_{t} \sim N (0, H_{t})) .

$y_t = \lambda_t + \varepsilon_t\quad (\varepsilon_t \sim N(0, H_t))\,.$ Kami memfilter pengamatan dari model lama, menggunakan model keadaan ruang [pembusukan kecepatan konstan] untuk evolusi

λ_{t}

$\lambda_t$ untuk mendapatkan keadaan yang disaring

E (λ_{t} | Y_{t})

$E(\lambda_t|Y_t)$ dan menandai anomali / kesalahan dalam perkiraan frekuensi kejadian dari data umpan jika

E (λ_{t} | Y_{t}) < y_{t}

$E(\lambda_t|Y_t) < y_t$ .

Pendekatan ini bekerja dengan sangat baik dalam mengambil kesalahan dalam estimasi peristiwa yang dihitung selama periode waktu penuh $T$ , tetapi tidak begitu baik jika kita ingin melakukan hal yang sama untuk periode lain $0 \leq t < \sigma$ where $\sigma < \frac{2}{3} T$ . Untuk mengatasi ini, kami telah memutuskan sekarang kami ingin beralih untuk menggunakan distribusi Binomial Negatif sehingga kami menganggap sekarang $X_t\sim NB(r, p)$ dan kami memiliki:

P (X_{t} \leq c) = p^{r} \sum_{k = 0}^{c} (1 - p)^{k} (\binom{k + r - 1}{r - 1}),

$\P(X_{t} \leq c) = p^{r}\sum_{k = 0}^c (1 - p)^{k}\binom{k + r -1}{r - 1},$ mana parameter

λ

$\lambda$ sekarang diganti oleh

r

$r$ dan

p

$p$ . Ini harus langsung diimplementasikan, tetapi saya mengalami beberapa kesulitan dengan interpretasi dan karenanya saya memiliki beberapa pertanyaan yang saya ingin Anda bantu:

1. Bisakah kita mengatur $p = \lambda$ dalam distribusi binomial negatif? Jika tidak, mengapa tidak?

2. Dengan anggapan kita dapat mengatur $p = f(\lambda)$ mana $f$ adalah beberapa fungsi, bagaimana kita dapat dengan benar mengatur $r$ (apakah kita perlu mencocokkan $r$ menggunakan set data terakhir)?

3. Apakah $r$ tergantung pada jumlah peristiwa yang kita harapkan terjadi selama proses tertentu?

Tambahan untuk mengekstraksi perkiraan untuk $r$ (dan $p$ ):

Saya menyadari bahwa jika kita sebenarnya memiliki masalah ini terbalik, dan kami memiliki jumlah acara untuk setiap proses, kami dapat mengadopsi penduga kemungkinan maksimum untuk dan . Tentu saja penaksir kemungkinan maksimum hanya ada untuk sampel yang varians sampelnya lebih besar dari rata-rata sampel, tetapi jika hal ini terjadi, kami dapat mengatur fungsi kemungkinan untuk pengamatan independen yang terdistribusi secara identik as: dari mana kita dapat menulis fungsi kemungkinan log sebagai: $r$ $p$ $N$ $k_1, k_2, \ldots, k_{N}$

L (r, p) = \prod_{i = 1}^{N} P (k_{i}; r, p),

$L(r, p) = \prod_{i = 1}^{N}\P(k_i; r, p),$

l (r, p) = \sum_{i = 1}^{N} \ln (Γ (k_{i} + r)) - \sum_{i = 1}^{N} \ln (k_{i}!) - N \ln (Γ (r)) + \sum_{i = 1}^{N} k_{i} \ln (p) + N r \ln (1 - p) .

$l(r, p) = \sum_{i = 1}^{N} \ln(\Gamma(k_i + r)) - \sum_{i = 1}^{N} \ln(k_{i}!) - N\ln(\Gamma(r)) + \sum_{i = 1}^{N} k_i \ln(p) + N r\ln(1 - p).$ Untuk menemukan maksimum, kami mengambil turunan parsial sehubungan dengan dan dan menetapkannya sama dengan nol: Pengaturan dan pengaturan kami menemukan:

r

$r$

p

$p$

\begin{aligned} \partial_{r} l (r, p) & = \sum_{i = 1}^{N} ψ (k_{i} + r) - N ψ (r) + N \ln (1 - p), \\ \partial_{p} l (r, p) & = \sum_{i = 1}^{N} k_{i} \frac{1}{p} - N r \frac{1}{1 - p} . \end{aligned}

$\begin{align*} \partial_{r} l(r, p) &= \sum_{i = 1}^{N} \psi(k_i + r) - N\psi(r) + N\ln(1 - p), \\ \partial_{p} l(r, p) &= \sum_{i = 1}^{N} k_i\frac{1}{p} - N r \frac{1}{1 - p} \enspace . \end{align*}$

\partial_{r} l (r, p) = \partial_{p} l (r, p) = 0

$\partial_{r} l(r, p) = \partial_{p} l(r, p) = 0$

p = \sum_{i = 1}^{N} \frac{k_{i}}{(N r + \sum_{i = 1}^{N} k_{i})},

$p = \displaystyle\sum_{i = 1}^{N} \displaystyle\frac{k_i} {(N r + \sum_{i = 1}^{N} k_i)},$

\partial_{r} l (r, p) = \sum_{i = 1}^{N} ψ (k_{i} + r) - N ψ (r) + N \ln (\frac{r}{r + \sum_{i = 1}^{N} \frac{k_{i}}{N}}) = 0.

$\partial_{r} l(r, p) = \sum_{i = 1}^{N} \psi(k_i + r) - N \psi(r) + N\ln\left(\frac{r}{r + \sum_{i = 1}^{N} \frac{k_i}{N}}\right) = 0.$ Persamaan ini tidak dapat diselesaikan untuk r dalam bentuk tertutup menggunakan Newton atau bahkan EM. Namun, ini tidak terjadi dalam situasi ini. Meskipun kita bisa menggunakan data masa lalu untuk mendapatkan dan statis, ini tidak benar-benar digunakan untuk proses kita, kita perlu menyesuaikan parameter ini dalam waktu, seperti yang kita lakukan menggunakan Poisson.

r

$r$

p

$p$

negative-binomial kalman-filter poisson-process state-space-models Ksatria bulan
sumber

Mengapa tidak menyambungkan data Anda ke model regresi Poisson atau Negatif Binomial?

StatsStudent

Saya tidak merasa itu harus memiliki untuk digunakan. Mengingat bahwa Poisson adalah kasus pembatas dari Binomial Negatif, harus ada beberapa cara untuk mengukur masalah ini dengan cara yang sama seperti yang telah saya lakukan untuk Poisson. Selain itu, proses ini terjadi secara bersamaan untuk ribuan proses yang berbeda dan tidak ada yang memiliki "tingkat kejadian" yang sama, yang berarti analisis regresi untuk parameter ini harus dilakukan pada setiap pengamatan baru untuk semua proses langsung. Ini tidak layak. Terima kasih banyak telah meluangkan waktu untuk membaca pertanyaan dan komentar saya, ini sangat dihargai ...

MoonKnight

Dalam hal menautkan poisson ke NB, jika Anda memiliki dengan variabel dispersi tersembunyi sehingga dan . Ini akan memberikan distribusi NB marjinal setelah mengintegrasikan . Anda bisa menggunakan ini untuk membantu.

(X_{t} | λ_{t}, r_{t}, g_{t}) \sim P o i s (λ_{t} g_{t})

$(X_t|\lambda_t,r_t,g_t)\sim Pois (\lambda_tg_t)$

(g_{t} | r_{t}) \sim G a m m a (r_{t}, r_{t})

$(g_t|r_t)\sim Gamma (r_t,r_t)$

E (g_{t}) = 1

$E (g_t)=1$

v a r (g_{t}) = r_{t}^{- 1}

$var(g_t)=r_t^{-1}$

g_{t}

$g_t$

probabilityislogic

Itu sangat membantu, tetapi apakah Anda dapat menyempurnakan ini sedikit lebih banyak dan memberikan beberapa rincian eksplisit? Terima kasih banyak atas waktu Anda ...

MoonKnight

Bagaimana dengan menggunakan binomial daripada binomial negatif? Itu mungkin lebih mudah dilakukan. Anscombe FJ. Transformasi data Poisson, binomial, dan negatif-binomial. Biometrika. 1948; 35: 246-54.

Carl

Beralih dari Memodelkan Proses menggunakan Distribusi Poisson untuk menggunakan Distribusi Binomial Negatif?

Jawaban: