Simulasikan dari distribusi normal campuran terpotong

Saya ingin mensimulasikan sampel dari distribusi normal campuran

p \times N (μ_{1}, σ_{1}^{2}) + (1 - p) \times N (μ_{2}, σ_{2}^{2})

$p\times\mathcal{N}(\mu_1,\sigma_1^2) + (1-p)\times\mathcal{N}(\mu_2,\sigma_2^2)$

terbatas pada interval $[0,1]$ dari pada $\mathbb{R}$ . Ini berarti saya ingin mensimulasikan campuran terpotong dari distribusi normal.

Saya tahu bahwa ada beberapa algoritma untuk mensimulasikan sebuah terpotong normal (yaitu dari pertanyaan ini ) dan paket yang sesuai dalam R untuk melakukan ini. Tetapi bagaimana saya bisa mensimulasikan campuran terpotong normal? Apakah sama jika saya mensimulasikan dua terpotong normal $\mathcal{N}(\mu_1,\sigma_1^2)$ dan $\mathcal{N}(\mu_2,\sigma_2^2$ ) untuk membuat campuran terpotong normal?

simulation random-generation cdf mixture gaussian-mixture Alexy
sumber

Jika ada pada interval unit, mengapa tidak menggunakan beta daripada normal? Untuk

α = β > 1

$\alpha=\beta>1$ , distribusinya simetris dan unimodal dan dibatasi pada interval satuan.

Sycorax berkata Reinstate Monica

Jika Anda tidak membutuhkan simulasi dengan sangat cepat, Anda dapat melakukannya dengan menggunakan sampel penolakan: (1) sampel

x

$x$ dari campuran dua normals, (2) jika

x

$x$ tidak ada di

[0, 1]

$[0,1]$ , kembali ke langkah 1, (3) keluaran

x

$x$ . (tetapi user777 benar, apakah Anda memiliki alasan yang baik untuk memilih distribusi ini alih-alih campuran betas?)

Elvis

@ user777 campuran Truncated Gaussian memiliki distribusi yang berbeda dari distribusi Beta dan tidak dapat ditukar hanya karena Anda dapat menerapkan simetri dan dukungan yang sama.

mjnichol

Simulasi dari normal terpotong mudah dilakukan jika Anda memiliki akses ke fungsi kuantil normal yang tepat. Misalnya, dalam R, mensimulasikan

N_{a}^{b} (μ, σ^{2})

$\mathcal{N}_a^b(\mu,\sigma^2)$ dimana

a

$a$ dan

b

$b$ menunjukkan batas bawah dan atas dapat dilakukan dengan membalik cdf

\frac{Φ (σ^{- 1} {x - μ}) - Φ (σ^{- 1} {a - μ})}{Φ (σ^{- 1} {b - μ}) - Φ (σ^{- 1} {a - μ})}

$\dfrac{\Phi(\sigma^{-1}\{x-\mu\})-\Phi(\sigma^{-1}\{a-\mu\})}{\Phi(\sigma^{-1}\{b-\mu\})-\Phi(\sigma^{-1}\{a-\mu\})}$ misalnya dalam R

x = mu + sigma * qnorm( pnorm(a,mu,sigma) + 
     runif(1)*(pnorm(b,mu,sigma) - pnorm(a,mu,sigma)) )

Kalau tidak, saya mengembangkan algoritma accept-reject yang terpotong dua puluh tahun yang lalu.

Jika kita mempertimbangkan masalah campuran terpotong, dengan kepadatan

f (x; θ) \propto {p φ (x; μ_{1}, σ_{1}) + (1 - p) φ (x; μ_{2}, σ_{2})} I_{[a, b]} (x)

$f(x;\theta) \propto \left\{p\varphi(x;\mu_1,\sigma_1)+(1-p)\varphi(x;\mu_2,\sigma_2)\right\}\mathbb{I}_{[a,b]}(x)$ itu adalah campuran dari distribusi normal terpotong tetapi dengan bobot yang berbeda :

f (x; θ) \propto p {Φ (σ_{1}^{- 1} {b - μ_{1}}) - Φ (σ_{1}^{- 1} {a - μ_{1}})} \frac{σ_{1}^{- 1} ϕ (σ_{1}^{- 1} {x - μ_{1}})}{Φ (σ_{1}^{- 1} {b - μ_{1}}) - Φ (σ_{1}^{- 1} {a - μ_{1}})} + (1 - p) {Φ (σ_{2}^{- 1} {b - μ_{2}}) - Φ (σ_{2}^{- 1} {a - μ_{2}})} \frac{σ_{2}^{- 1} ϕ (σ_{2}^{- 1} {x - μ_{2}})}{Φ (σ_{2}^{- 1} {b - μ_{2}}) - Φ (σ_{1}^{- 1} {a - μ_{2}})}

$f(x;\theta) \propto p\left\{\Phi(\sigma_1^{-1}\{b-\mu_1\})-\Phi(\sigma_1^{-1}\{a-\mu_1\}) \right\}\dfrac{\sigma_1^{-1}\phi(\sigma_1^{-1}\{x-\mu_1\})}{\Phi(\sigma_1^{-1}\{b-\mu_1\})-\Phi(\sigma_1^{-1}\{a-\mu_1\})} \\[15pt] +(1-p)\left\{\Phi(\sigma_2^{-1}\{b-\mu_2\})-\Phi(\sigma_2^{-1}\{a-\mu_2\}) \right\}\dfrac{\sigma_2^{-1}\phi(\sigma_2^{-1}\{x-\mu_2\})}{\Phi(\sigma_2^{-1}\{b-\mu_2\})-\Phi(\sigma_1^{-1}\{a-\mu_2\})}$ Oleh karena itu, untuk mensimulasikan dari campuran normal terpotong, cukup untuk mengambil

x = {\begin{cases} x_{1} \sim N_{a}^{b} (μ_{1}, σ_{1}^{2}) & with probability \\ p {Φ (σ_{1}^{- 1} {b - μ_{1}}) - Φ (σ_{1}^{- 1} {a - μ_{1}})} / s \\ x_{2} \sim N_{a}^{b} (μ_{2}, σ_{2}^{2}) & with probability \\ (1 - p) {Φ (σ_{2}^{- 1} {b - μ_{2}}) - Φ (σ_{2}^{- 1} {a - μ_{2}})} / s \end{cases}

$x=\begin{cases} x_1\sim\mathcal{N}_a^b(\mu_1,\sigma_1^2) &\text{with probability }\\ &\qquad p\left\{\Phi(\sigma_1^{-1}\{b-\mu_1\})-\Phi(\sigma_1^{-1}\{a-\mu_1\}) \right\}\big/\mathfrak{s}\\ x_2\sim\mathcal{N}_a^b(\mu_2,\sigma_2^2) &\text{with probability }\\ &\qquad(1-p)\left\{\Phi(\sigma_2^{-1}\{b-\mu_2\})-\Phi(\sigma_2^{-1}\{a-\mu_2\}) \right\}\big/\mathfrak{s} \end{cases}$ dimana

\begin{aligned} s = & p {Φ (σ_{1}^{- 1} {b - μ_{1}}) - Φ (σ_{1}^{- 1} {a - μ_{1}})} + \\ (1 - p) {Φ (σ_{2}^{- 1} {b - μ_{2}}) - Φ (σ_{2}^{- 1} {a - μ_{2}})} \end{aligned}

$\begin{align} \mathfrak{s}=&p\left\{\Phi(\sigma_1^{-1}\{b-\mu_1\})-\Phi(\sigma_1^{-1}\{a-\mu_1\}) \right\}+ \\ &(1-p)\left\{\Phi(\sigma_2^{-1}\{b-\mu_2\})-\Phi(\sigma_2^{-1}\{a-\mu_2\}) \right\} \end{align}$

Xi'an
sumber

Mengapa kita tidak bisa mengambil sampel dari normal pertama dengan probabilitas p dan distribusi kedua dengan probabilitas 1 - p?

mjnichol

Ah! Saya rasa saya melihat masalahnya. Itu karena seluruh distribusi sedang terpotong, tidak masing-masing distribusi secara terpisah. Jika setiap sub-distribusi campuran dipotong secara individual sebelum ditambahkan ke dalam campuran, maka kita akan dapat dengan mudah mengambil sampel dari distribusi sesuai dengan bobot relatif masing-masing sub-distribusi, bukan?

mjnichol

@ mjnichol Ini adalah campuran tetapi dengan bobot berbeda dari

p

$p$ dan

1 - p

$1-p$ .

Xi'an

@ Xi'an: Misalkan kita mempertimbangkan setup yang sedikit berbeda: Bagaimana jika alih-alih membangun distribusi campuran dari Gaussians tertimbang dan kemudian memotong kita malah mencampur dua Gaussi yang sudah terpotong (dengan dukungan yang sama). Jika Gaussians dipotong sebelum pencampuran, apakah kita dapat mengambil sampel dari distribusi dengan mengambil sampel dari Gaussian terpotong pertama dengan probabilitas p dan yang kedua dengan probabilitas 1 - p?

mjnichol

@ mjnichol: dalam hal ini, Anda harus melakukannya

p N_{a}^{b} (μ_{1}, σ_{1}^{2}) + (1 - p) N_{a}^{b} (μ_{2}, σ_{2}^{2})

$p\mathcal{N}_a^b(\mu_1,\sigma_1^2)+(1-p)\mathcal{N}_a^b(\mu_2,\sigma_2^2)$ jadi ya memang ini akan berhasil.

Xi'an

Simulasikan dari distribusi normal campuran terpotong

Jawaban: