Distribusi perbedaan antara dua distribusi normal

21

Saya memiliki dua fungsi kepadatan probabilitas dari distribusi normal:

f1(x1|μ1,σ1)=1σ12πe-(x-μ1)22σ12

dan

f2(x2|μ2,σ2)=1σ22πe-(x-μ2)22σ22

Saya mencari fungsi densitas probabilitas pemisahan antara dan x 2 . Saya pikir itu berarti saya sedang mencari fungsi kepadatan probabilitas | x 1 - x 2 | . Apakah itu benar? Bagaimana saya menemukan itu?x1x2|x1-x2|

Martijn
sumber
Jika ini adalah pekerjaan rumah, silakan gunakan self-studytag. Kami menerima pertanyaan pekerjaan rumah, tetapi kami menanganinya sedikit berbeda di sini.
shadowtalker
Juga, saya tidak ingin menjadi "pria itu" tetapi apakah Anda mencoba Google? "Perbedaan antara distribusi normal" segera menemukan jawaban untuk saya.
shadowtalker
@ssdecontrol tidak, bukan pekerjaan rumah, tapi itu untuk proyek hobi, jadi saya tidak keberatan harus mencari tahu beberapa hal sendiri jika saya berada di jalur yang benar. Saya memang mencoba google, tetapi pemahaman saya tentang masalah ini sangat terbatas sehingga saya mungkin tidak akan mengenalinya jika itu tepat di depan saya. dengan kutipan saya menemukan banyak hal yang mirip dengan "apa perbedaan antara distribusi normal dan x" untuk beberapa x.
Martijn

Jawaban:

26

Pertanyaan ini dapat dijawab seperti yang dinyatakan hanya dengan mengasumsikan dua variabel acak dan X 2 diatur oleh distribusi ini adalah independen. X1X2 Ini membuat perbedaan mereka Normal dengan rata-rata μ = μ 2 - μ 1 dan varians σ 2 = σ 2 1 + σ 2 2 . (Solusi berikut ini dapat dengan mudah digeneralisasi untuk distribusi normal bivariat dari ( X 1 , X 2X=X2-X1μ=μ2-μ1σ2=σ12+σ22 .) Jadi variabelnya(X1,X2)

Z=X-μσ=X2-X1-(μ2-μ1)σ12+σ22

memiliki distribusi Normal standar (yaitu, dengan mean nol dan varians unit) dan

X=σ(Z+μσ).

Ekspresi

|X2-X1|=|X|=X2=σ(Z+μσ)2

menunjukkan perbedaan absolut sebagai versi berskala dari akar kuadrat dari distribusi chi-squared Non-sentral dengan satu derajat kebebasan dan parameter noncentrality . Distribusi chi-squared non-sentral dengan parameter ini memiliki elemen probabilitasλ=(μ/σ)2

f(y)dy=y2πe12(-λ-y)tongkat pendek(λy)dyy, y>0.

Menulis untuk x > 0 menetapkan korespondensi satu-ke-satu antara y dan akar kuadratnya, menghasilkany=x2x>0y

f(y)dy=f(x2)d(x2)=x22πe12(λx2)cosh(λx2)dx2x2.

Menyederhanakan ini dan kemudian menskalakan dengan memberikan kepadatan yang diinginkan,σ

f|X|(x)=1σ2πcosh(xμσ2)exp(x2+μ22σ2).

This result is supported by simulations, such as this histogram of 100,000 independent draws of |X|=|X2X1| (called "x" in the code) with parameters μ1=1,μ2=5,σ1=4,σ2=1. On it is plotted the graph of f|X|, which neatly coincides with the histogram values.

Angka

The R code for this simulation follows.

#
# Specify parameters
#
mu <- c(-1, 5)
sigma <- c(4, 1)
#
# Simulate data
#
n.sim <- 1e5
set.seed(17)
x.sim <- matrix(rnorm(n.sim*2, mu, sigma), nrow=2)
x <- abs(x.sim[2, ] - x.sim[1, ])
#
# Display the results
#
hist(x, freq=FALSE)
f <- function(x, mu, sigma) {
 sqrt(2 / pi) / sigma * cosh(x * mu / sigma^2) * exp(-(x^2 + mu^2)/(2*sigma^2)) 
}
curve(f(x, abs(diff(mu)), sqrt(sum(sigma^2))), lwd=2, col="Red", add=TRUE)
whuber
sumber
How would this be different if I want to get the squared difference? For example if I want (f1(.)f2(.))2?
user77005
1
@ user77005 Jawabannya ada di posting saya: ini adalah distribusi chi-squared non-sentral. Ikuti tautan untuk detailnya.
whuber
22

Saya memberikan jawaban yang komplementer untuk yang oleh @whuber dalam arti menjadi apa yang non-statistik (yaitu seseorang yang tidak tahu banyak tentang distribusi chi-square non-sentral dengan satu derajat kebebasan dll) mungkin menulis, dan bahwa orang baru bisa mengikuti dengan relatif mudah.

Meminjam asumsi independensi serta notasi dari jawaban whuber ,Z=X1-X2N(μ,σ2) dimana μ=μ1-μ2 dan σ2=σ12+σ22. Jadi, untukx0,

F|Z|(x)P{|Z|x}=P{-xZx}=P{-x<Zx}sejak Z adalah variabel acak kontinu=FZ(x)-FZ(-x),
dan tentu saja, F|Z|(x)=0 untuk x<0. Ini mengikuti setelah membedakan sehubungan denganx bahwa
f|Z|(x)xF|Z|(x)=[fZ(x)+fZ(-x)]1(0,)(x)=[exp(-(x-μ)22σ2)σ2π+exp(-(x+μ)22σ2)σ2π]1(0,)(x)=exp(-x2+μ22σ2)σ2π(exp(xμσ2)+exp(xμσ2))1(0,)(x)=1σ2πtongkat pendek(xμσ2)exp(-x2+μ22σ2)1(0,)(x)
yang merupakan hasil yang sama persis dengan jawaban whuber, tetapi sampai pada lebih transparan.
Dilip Sarwate
sumber
1
+1 Saya selalu ingin melihat solusi yang bekerja dari prinsip dan asumsi yang paling mendasar.
whuber
1

Distribusi perbedaan dua varian terdistribusi normal X dan Y juga merupakan distribusi normal, dengan asumsi X dan Y independen (terima kasih Mark atas komentarnya). Berikut adalah turunannya: http://mathworld.wolfram.com/NormalDifferenceDistribution.html

Di sini Anda menanyakan perbedaan absolut, berdasarkan jawaban whuber dan jika kami menganggap perbedaan rata-rata X dan Y adalah nol, itu hanya setengah distribusi normal dengan kepadatan dua kali lipat (terima kasih Dilip atas komentarnya).

Yuqian
sumber
3
Anda dan Wolfram Mathworld secara implisit mengasumsikan bahwa 2 distribusi normal (variabel acak) adalah independen. Perbedaannya bahkan belum tentu terdistribusi normal jika 2 variabel acak normal tidak normal bivariat, yang dapat terjadi jika mereka tidak independen ..
Mark L. Stone
4
Selain asumsi yang ditunjukkan oleh Mark, Anda juga mengabaikan fakta bahwa cara-caranya berbeda. Kasus setengah normal hanya bekerja ketikaμ1=μ2 sehingga perbedaannya berarti 0.
Dilip Sarwate
Terima kasih atas komentar anda Sekarang saya merevisi jawaban saya berdasarkan komentar dan jawaban whuber Anda.
yuqian