Perbedaan dua variabel acak logid normal

23

Biarkan dan menjadi 2 iidrv di mana . Saya ingin tahu distribusi untuk .X 2 log ( X 1 ) , log ( X 2 ) N ( μ , σ ) X 1 - X 2X1X2log(X1),log(X2)N(μ,σ)X1-X2

Yang terbaik yang bisa saya lakukan adalah mengambil deret Taylor dari keduanya dan mendapatkan bahwa perbedaannya adalah jumlah perbedaan antara dua rv normal dan dua rv kuadrat-ku selain sisa perbedaan antara sisa istilah. Apakah ada cara yang lebih mudah untuk mendapatkan distribusi perbedaan antara 2 iid log-normal rv's?

frayedchef
sumber
Ini makalah yang relevan. Anda akan menemukan lebih banyak kertas dengan googling! papers.ssrn.com/sol3/papers.cfm?abstract_id=2064829
b halvorsen
1
Saya telah melihat sekilas pada kertas itu, dan sepertinya tidak menjawab pertanyaan saya dengan cara yang memuaskan. Mereka tampaknya peduli dengan perkiraan numerik untuk masalah yang lebih sulit menemukan distribusi untuk jumlah / perbedaan antara rn lognormal berkorelasi . Saya berharap akan ada jawaban yang lebih sederhana untuk kasus independen.
frayedchef
2
Ini mungkin jawaban yang lebih sederhana dalam kasus independen, tetapi bukan jawaban yang sederhana! Kasus lognormal adalah kasus terkenal yang terkenal --- fungsi penghasil momen dari distribusi lognormal tidak ada --- yaitu, ia tidak bertemu pada interval terbuka yang mengandung nol. Jadi, Anda tidak akan menemukan solusi yang mudah.
kjetil b halvorsen
Begitu ... Jadi, apakah pendekatan yang saya uraikan di atas masuk akal? (yaitu, jika , Apakah kita tahu apa-apa tentang syarat-syarat pesanan yang lebih tinggi, atau bagaimana mengikat mereka?X 1 - X 2( Y 1 - Y 2 ) + ( Y 2 1 - Y 2 2 ) / 2 +Ysaya=log(Xsaya)X1-X2(Y1-Y2)+(Y12-Y22)/2+...
frayedchef
1
Untuk mengilustrasikan kesulitan --- mgf lognormal hanya didefinisikan pada . Untuk memperkirakan distribusi perbedaan dengan metode saddlepoint, kita perlu (K = kumulans gf) , dan jumlah itu hanya didefinisikan dalam satu poin, nol Jadi, sepertinya tidak berfungsi Jumlah atau rata-rata akan lebih mudah!K ( s ) + K ( - s )(,0]K(s)+K(-s)
kjetil b halvorsen

Jawaban:

15

Ini masalah yang sulit. Saya pertama kali berpikir tentang menggunakan (perkiraan) fungsi penghasil momen dari distribusi lognormal. Itu tidak berhasil, seperti yang akan saya jelaskan. Tetapi pertama-tama beberapa notasi:

Biarkan menjadi kepadatan normal standar dan Φ fungsi distribusi kumulatif yang sesuai. Kami hanya akan menganalisis distribusi kasus lognormal l n N ( 0 , 1 ) , yang memiliki fungsi kepadatan f ( x ) = 1ϕΦlnN(0,1) dan fungsi distribusi kumulatif F(x)=Φ(lnx) MisalkanXdanYadalah variabel acak independen dengan distribusi lognormal di atas. Kami tertarik pada distribusiD=X-Y, yang merupakan distribusi simetris dengan rata-rata nol. MariM(t)=EetXmenjadi fungsi pembangkit momenX. Ini didefinisikan hanya untukt

f(x)=12πxe-12(dalamx)2
F(x)=Φ(dalamx)
XYD=X-YM.(t)=EetXX , jadi tidak didefinisikan dalam interval terbuka yang berisi nol. Fungsi pembangkit momen untuk D adalah M D ( t ) = E e t ( X - Y ) = E e t X E e - t Y = M ( t ) M ( - t ) Jadi, fungsi menghasilkan momen untuk D hanya didefinisikan untuk t = 0t(-,0]DM.D(t)=Eet(X-Y)=EetXEe-tY=M.(t)M.(-t)Dt=0, jadi tidak terlalu berguna.

Dt0

P(Dt)=P(X-Yt)=0P(X-yt|Y=y)f(y)dy=0P(Xt+y)f(y)dy=0F(t+y)f(y)dy
t<0P(Dt)=1-P(D|t|)

Ungkapan ini dapat digunakan untuk integrasi numerik atau sebagai dasar untuk simulasi. Tes pertama:

 integrate(function(y) plnorm(y)*dlnorm(y), lower=0,  upper=+Inf)
  0.5 with absolute error < 2.3e-06

yang jelas benar. Mari kita selesaikan ini di dalam suatu fungsi:

pDIFF  <-  function(t) {
    d  <-  t
    for (tt in seq(along=t)) {
        if (t[tt] >= 0.0) d[tt] <- integrate(function(y) plnorm(y+t[tt])*dlnorm(y),
                                         lower=0.0,  upper=+Inf)$value else
                          d[tt] <- 1-integrate(function(y) plnorm(y+abs(t[tt]))*dlnorm(y),
                                         lower=0.0, upper=+Inf)$value
    }
    return(d)
}

> plot(pDIFF,  from=-5,  to=5)

pemberian yang mana:

fungsi distribusi kumulatif ditemukan oleh integrasi numerik

Kemudian kita dapat menemukan fungsi kerapatan dengan membedakan di bawah tanda integral, memperoleh

dDIFF  <-  function(t) {
       d  <- t; t<- abs(t)
       for (tt in seq(along=t)) {
           d[tt]  <-  integrate(function(y) dlnorm(y+t[tt])*dlnorm(y),
                                lower=0.0,  upper=+Inf)$value
       }
       return(d)
}

yang dapat kami uji:

> integrate(dDIFF,  lower=-Inf,  upper=+Inf)
0.9999999 with absolute error < 1.3e-05

Dan memplot kepadatan yang kita dapatkan:

plot(dDIFF,  from=-5,  to=5)

fungsi kepadatan ditemukan oleh integrasi numerik

Saya juga mencoba untuk mendapatkan beberapa perkiraan analitik, tetapi sejauh ini tidak berhasil, ini bukan masalah yang mudah. Tetapi integrasi numerik seperti di atas, diprogram dalam R sangat cepat pada perangkat keras modern, sehingga merupakan alternatif yang baik yang mungkin harus digunakan lebih banyak.

kjetil b halvorsen
sumber
1

XY

Pr(XYt)=Pr(log(XY)log(t))=Pr(log(X)-log(Y)log(t))N(0,2σ2)

Tergantung pada aplikasi Anda, ini dapat melayani kebutuhan Anda.

Vincent Traag
sumber
3
Tapi bukankah kita melihat XY bukannya log (X) - log (Y)?
Sextus Empiricus
Ya tentu saja. Ini hanya dalam kasus seseorang akan tertarik mengetahui bagaimana dua variabel lognormal berbeda satu sama lain tanpa harus perlu menjadi perbedaan. Itu sebabnya saya juga mengatakan itu tidak menjawab pertanyaan.
Vincent Traag