Menghasilkan variabel acak binomial berkorelasi

Variabel binomial biasanya dibuat dengan menjumlahkan variabel Bernoulli independen. Mari kita lihat apakah kita bisa mulai dengan sepasang variabel Bernoulli yang berkorelasi dan melakukan hal yang sama. $(X,Y)$

Misalkan adalah variabel Bernoulli (yaitu, dan $X$ $(p)$ $\Pr(X=1)=p$ ) dan adalahvariabelBernoulli . Untuk menjabarkan distribusi bersama mereka, kita perlu menentukan keempat kombinasi hasil. Penulisan $\Pr(X=0)=1-p$ $Y$ $(q)$ kita dapat dengan mudah mengetahui sisanya dari aksioma probabilitas:

Pr ((X, Y) = (0, 0)) = a,

$\Pr((X,Y)=(0,0))=a,$

Pr ((X, Y) = (1, 0)) = 1 - q - Sebuah, Pr ((X, Y) = (0, 1)) = 1 - hal - Sebuah, Pr ((X, Y) = (1, 1)) = Sebuah + hal + q - 1.

$\Pr((X,Y)=(1,0))=1-q-a, \\\Pr((X,Y)=(0,1))=1-p-a, \\\Pr((X,Y)=(1,1))=a+p+q-1.$

Memasukkan ini ke dalam rumus untuk koefisien korelasi dan penyelesaiannya memberikan $\rho$

\begin{matrix} (1) & a = (1 - p) (1 - q) + ρ \sqrt{p q (1 - p) (1 - q)} . \end{matrix}

$a = (1-p)(1-q) + \rho\sqrt{{pq}{(1-p)(1-q)}}.\tag{1}$

Asalkan keempat probabilitas non-negatif, ini akan memberikan distribusi gabungan yang valid - dan solusi ini membuat parameter semua distribusi Bernoulli bivariat. (Ketika , ada solusi untuk semua korelasi yang bermakna secara matematis antara dan ) Ketika kita menjumlahkan dari variabel-variabel ini, korelasinya tetap sama - tetapi sekarang distribusi marjinal adalah Binomial dan Binomial , seperti yang diinginkan. $p=q$ $-1$ $1$ $n$ $(n,p)$ $(n,q)$

Contoh

Biarkan , , , dan kami ingin korelasi menjadi $n=10$ $p=1/3$ $q=3/4$ $\rho=-4/5$ $(1)$ $a=0.00336735$ $0.247$ $0.663$ $0.087$ $1000$

Garis merah menunjukkan rata-rata sampel dan garis putus-putus adalah garis regresi. Mereka semua dekat dengan nilai yang dimaksudkan. Poin-poin telah dikelompokkan secara acak dalam gambar ini untuk menyelesaikan tumpang tindih: setelah semua, distribusi Binomial hanya menghasilkan nilai-nilai integral, sehingga akan ada banyak overplotting.

$n$ $\{1,2,3,4\}$ $1$ $(0,0)$ $2$ $(1,0)$ $3$ $(0,1)$ $4$ $(1,1)$ $(X,Y)$

Kode

Berikut ini adalah Rimplementasinya.

#
# Compute Pr(0,0) from rho, p=Pr(X=1), and q=Pr(Y=1).
#
a <- function(rho, p, q) {
  rho * sqrt(p*q*(1-p)*(1-q)) + (1-p)*(1-q)
}
#
# Specify the parameters.
#
n <- 10
p <- 1/3
q <- 3/4
rho <- -4/5
#
# Compute the four probabilities for the joint distribution.
#
a.0 <- a(rho, p, q)
prob <- c(`(0,0)`=a.0, `(1,0)`=1-q-a.0, `(0,1)`=1-p-a.0, `(1,1)`=a.0+p+q-1)
if (min(prob) < 0) {
  print(prob)
  stop("Error: a probability is negative.")
}
#
# Illustrate generation of correlated Binomial variables.
#
set.seed(17)
n.sim <- 1000
u <- sample.int(4, n.sim * n, replace=TRUE, prob=prob)
y <- floor((u-1)/2)
x <- 1 - u %% 2
x <- colSums(matrix(x, nrow=n)) # Sum in groups of `n`
y <- colSums(matrix(y, nrow=n)) # Sum in groups of `n`
#
# Plot the empirical bivariate distribution.
#
plot(x+rnorm(length(x), sd=1/8), y+rnorm(length(y), sd=1/8),
     pch=19, cex=1/2, col="#00000010",
     xlab="X", ylab="Y",
     main=paste("Correlation is", signif(cor(x,y), 3)))
abline(v=mean(x), h=mean(y), col="Red")
abline(lm(y ~ x), lwd=2, lty=3)

whuber
sumber

Bisakah pendekatan ini diperluas untuk menghasilkan sejumlah variabel biner? - agar sesuai dengan matriks korelasi yang diberikan (atau hampir pas untuk itu)?

ttnphns

2^{k}

$2^k$

k

$k$

2^{k} - k - 1

$2^k-k-1$

n

$n$

n

$n$

n

$n$

Ini hasil yang bagus. Hanya untuk memilih sedikit pada kalimat pertama Anda. Untuk mendapatkan binomial dari variabel independen Bernoulli, bukankah mereka harus memiliki p yang sama? Ini tidak berpengaruh pada apa yang Anda lakukan karena itu hanya motivasi untuk pendekatan Anda.

Michael R. Chernick

p

$p$

X

$X$

q

$q$

Y

$Y$ variabelUntuk menjaga agar posnya cukup singkat, saya tidak menampilkan histogram distribusi marjinal untuk menunjukkan bahwa mereka memang Binomial (tapi saya benar-benar melakukannya dalam analisis asli saya hanya untuk memastikan mereka berfungsi!).

whuber

@whuber Pendekatan yang bagus! Bisakah Anda memberi tahu saya jika ada kertas yang bisa saya lihat ??

T Nick

Menghasilkan variabel acak binomial berkorelasi

Jawaban:

Contoh

Kode