Ekspektasi Log Invers pada Variabel Acak Normal

8

Saya memiliki variabel acak Y=eX1+eX dan saya tahu XN(μ,σ2).

Apakah ada cara untuk menghitung E(Y)? Saya telah mencoba untuk mengerjakan integral, tetapi belum membuat banyak kemajuan. Apakah itu mungkin?

Henry
sumber
3
Rupanya, solusi analitis tidak diketahui. Perkiraan yang diketahui diberikan dalam tautan stackexchange
Greenparker
Jika μ=0, kemudian E[Y]=12, untuk apa saja σ.
serigala
@ serigala Bisakah Anda memberikan sumber / derivasi dari itu?
Greenparker
2
@ Greenparker Pembagian Y1/2 simetris di sekitar 0dalam hal ini, QED.
whuber
1
Saya melakukannya secara simbolis sebagai satu-liner dengan mathStatica / Mathematica ... tetapi cara mudah untuk melihat mengapa harus begitu: ...... (i) jika XN(0,σ2), maka pdf-nya simetris sekitar 0. (ii) Pertimbangkan transformasi Z=Y12=12tanh(x/2). KemudianZ adalah kurva berbentuk S simetris tentang X=0, dan E [Z] harus sama dengan 0 (dengan simetri). SejakY=Z+12, karena itu E[Y]=12
serigala

Jawaban:

5

Seperti yang sudah disebutkan dalam komentar pertanyaan dan jawaban oleh @ Martijn tampaknya tidak ada solusi analitis untuk E(Y) terlepas dari kasus khusus di mana μ=0 pemberian yang mana E(Y)=0.5.

Selain itu oleh ketidaksetaraan Jensen kita memilikinyaE(Y)=E(f(X))<f(E(X)) jika μ>0 dan sebaliknya itu E(Y)=E(f(X))>f(E(X)) jika μ<0. Sejakf(x)=ex1+ex cembung saat x<0 dan cekung kapan x>0 dan sebagian besar massa kerapatan normal akan terletak di wilayah tersebut tergantung pada nilai μ.

Ada banyak cara untuk memperkirakan E(Y), Saya telah merinci beberapa yang saya kenal dan menyertakan beberapa kode R pada akhirnya.

Contoh

Ini cukup mudah dimengerti / diimplementasikan:

E(Y)=f(x)N(x|μ,σ2)dx1nΣi=1nf(xi)

tempat kami mengambil sampel x1,,xn dari N(μ,σ2).

Integrasi numerik

Ini mencakup banyak metode untuk mendekati integral di atas - dalam kode I menggunakan fungsi integrasi R yang menggunakan quadrature adaptif.

Transformasi tanpa aroma

Lihat misalnya Filter Kalman Tanpa Wangi untuk Estimasi Nonlinear oleh Eric A. Wan dan Rudolph van der Merwe yang menjelaskan:

Transformasi unscented (UT) adalah metode untuk menghitung statistik dari variabel acak yang mengalami transformasi nonlinier

Metode ini melibatkan penghitungan sejumlah kecil "titik sigma" yang kemudian ditransformasikan oleh fdan rata-rata tertimbang diambil. Ini berbeda dengan pengambilan sampel acak banyak titik, mengubahnya denganf dan mengambil mean.

Metode ini jauh lebih efisien secara komputasi daripada pengambilan sampel secara acak. Sayangnya saya tidak dapat menemukan implementasi R online sehingga belum memasukkannya dalam kode di bawah ini.

Kode

Kode berikut membuat data dengan nilai yang berbeda dari μ dan diperbaiki σ. Ini menghasilkan f_muyangf(E(X)), dan perkiraan E(Y)=E(f(X))melalui samplingdan integration.

integrate_approx <- function(mu, sigma) {
    f <- function(x) {
        plogis(x) * dnorm(x, mu, sigma)
    }
    int <- integrate(f, lower = -Inf, upper = Inf)
    int$value
}

sampling_approx <- function(mu, sigma, n = 1e6) {
    x <- rnorm(n, mu, sigma)
    mean(plogis(x))
}

mu <- seq(-2.0, 2.0, by = 0.5)

data <- data.frame(mu = mu,
                   sigma = 3.14,
                   f_mu = plogis(mu),
                   sampling = NA,
                   integration = NA)

for (i in seq_len(nrow(data))) {
    mu <- data$mu[i]
sigma <- data$sigma[i]
    data$sampling[i] <- sampling_approx(mu, sigma)
data$integration[i] <- integrate_approx(mu, sigma)
}

keluaran:

    mu sigma      f_mu  sampling integration
1 -2.0  3.14 0.1192029 0.2891102   0.2892540
2 -1.5  3.14 0.1824255 0.3382486   0.3384099
3 -1.0  3.14 0.2689414 0.3902008   0.3905315
4 -0.5  3.14 0.3775407 0.4450018   0.4447307
5  0.0  3.14 0.5000000 0.4999657   0.5000000
6  0.5  3.14 0.6224593 0.5553955   0.5552693
7  1.0  3.14 0.7310586 0.6088106   0.6094685
8  1.5  3.14 0.8175745 0.6613919   0.6615901
9  2.0  3.14 0.8807971 0.7105594   0.7107460

EDIT

Saya benar-benar menemukan mudah untuk menggunakan transformasi tanpa wewangian dalam paket python filterpy (meskipun sebenarnya cukup cepat untuk diimplementasikan dari awal):

import filterpy.kalman as fp
import numpy as np
import pandas as pd


def sigmoid(x):
    return 1.0 / (1.0 + np.exp(-x))


m = 9
n = 1
z = 1_000_000
alpha = 1e-3
beta = 2.0
kappa = 0.0
means = np.linspace(-2.0, 2.0, m)
sigma = 3.14
points = fp.MerweScaledSigmaPoints(n, alpha, beta, kappa)
ut = np.empty_like(means)
sampling = np.empty_like(means)

for i, mean in enumerate(means):
    sigmas = points.sigma_points(mean, sigma**2)
    trans_sigmas = sigmoid(sigmas)
    ut[i], _ = fp.unscented_transform(trans_sigmas, points.Wm, points.Wc)

    x = np.random.normal(mean, sigma, z)
    sampling[i] = np.mean(sigmoid(x))

print(pd.DataFrame({"mu": means,
                    "sigma": sigma,
                    "ut": ut,
                    "sampling": sampling}))

yang keluaran:

    mu  sigma        ut  sampling
0 -2.0   3.14  0.513402  0.288771
1 -1.5   3.14  0.649426  0.338220
2 -1.0   3.14  0.716851  0.390582
3 -0.5   3.14  0.661284  0.444856
4  0.0   3.14  0.500000  0.500382
5  0.5   3.14  0.338716  0.555246
6  1.0   3.14  0.283149  0.609282
7  1.5   3.14  0.350574  0.662106
8  2.0   3.14  0.486598  0.710284

Jadi transformasi tanpa wewenang tampaknya berkinerja sangat buruk untuk nilai - nilai ini μ dan σ. Ini mungkin tidak mengejutkan karena transformasi tanpa wewenang mencoba untuk menemukan perkiraan normal terbaikY=f(X) dan dalam hal ini jauh dari normal:

import matplotlib.pyplot as plt

x = np.random.normal(means[0], sigma, z)
plt.hist(sigmoid(x), bins=50)
plt.title("mu = {}, sigma = {}".format(means[0], sigma))
plt.xlabel("f(x)")
plt.show()

histogram

Untuk nilai yang lebih kecil dari σ sepertinya tidak apa-apa.

Jeff
sumber
3

Variabel Ymemiliki distribusi normal logit atau normal logistik yang momennya tidak memiliki deskripsi analitis yang diketahui. Anda dapat memperoleh nilai secara komputasi.

Lebih lanjut tentang distribusi ini dijelaskan dalam artikel yang tersedia secara bebas: Atchison, J., dan Sheng M. Shen. "Distribusi logistik-normal: Beberapa properti dan penggunaan." Biometrika 67.2 (1980): 261-272.

Dalam teks itu mereka tidak memberikan ekspresi apa pun untuk batasan, perkiraan atau perilaku momen (kecuali menyebutkan bahwa mereka ada). Tetapi, mereka melanjutkan dengan ekspresi untuk nilai ekspektasi untuk rasio dua komponen dalam variabel terdistribusi normal logistik multivariat.

Sextus Empiricus
sumber