Nilai dan varian log yang diharapkan (a)

20

Saya memiliki variabel acak X(a)=log(a) mana a adalah terdistribusi normal ( μ , σ 2 )N(μ,σ2) . Apa yang bisa saya katakan tentang E(X) dan Var(X) ? Suatu perkiraan akan sangat membantu juga.

rocksportrocker
sumber
4
Saya pikir pertanyaannya adalah tentang "kebalikan" dari log-normal, yaitu di mana rv A normal mengarah ke log-normal X = exp (A), si penanya bertanya tentang distribusi X = log (A), yang tidak terdefinisi (karena kadang-kadang membutuhkan log dari nomor negatif). Mungkin ada beberapa hasil untuk normal terpotong, tetapi mereka cenderung berantakan.
Martin O'Leary
2
rocksportrocker, seperti yang ditunjukkan oleh @Martin O'Leary, secara matematis tidak mungkin untuk memiliki variabel X , karena log(a) tidak ditentukan untuk nilai negatif. Minimal Anda harus memotong a non-negatif. Bisakah Anda memberi tahu kami mengapa Anda percaya bahwa a itu normal?
whuber

Jawaban:

23

Jika kita menganggap "aproksimasi" dalam pengertian yang cukup umum, kita bisa mendapatkan suatu tempat.

Kita harus berasumsi bukan bahwa kita memiliki distribusi normal aktual tetapi sesuatu yang mendekati normal kecuali kerapatan tidak boleh nol dalam lingkungan 0.

Jadi mari kita mengatakan bahwa adalah "kira-kira normal" (dan terkonsentrasi di dekat mean *) dalam arti bahwa kita dapat handwave pergi kekhawatiran tentang sebuah mendekati 0 (dan dampaknya selanjutnya pada saat-saat log ( a ) , karena sebuah doesn 't' turun dekat 0 '), tetapi dengan momen urutan rendah yang sama dengan distribusi normal yang ditentukan, maka kita bisa menggunakan deret Taylor untuk memperkirakan momen variabel acak yang ditransformasikan .aalog(a)a

Untuk beberapa transformasi , ini melibatkan perluasan g ( μ X + X - μ X ) sebagai deret Taylor (pikirkan g ( x + h ) di mana μ X mengambil peran ' x ' dan X - μ X mengambil peran ' h ') dan kemudian mengambil ekspektasi dan kemudian menghitung varians atau ekspektasi kuadrat ekspansi (dari mana dapat diperoleh varians).g(X)g(μX+XμX)g(x+h)μXxXμXh

Perkiraan perkiraan dan varian yang dihasilkan adalah:

E[g(X)]g(μX)+g(μX)2σX2

Var[g(X)](g(μX))2σX2

dan jadi (jika saya tidak membuat kesalahan), ketika :g()=log()

E[log(a)]log(μa)σa22μa2

Var[log(a)]σa2/μa2

* Agar ini menjadi perkiraan yang baik, Anda biasanya ingin standar deviasi menjadi cukup kecil dibandingkan dengan rata-rata (koefisien variasi yang rendah).a

Glen_b -Reinstate Monica
sumber
2
Karena seri Taylor untuk log memiliki radius konvergensi yang relatif kecil, disarankan untuk menerapkan perkiraan ini.
whuber
@whuber untuk ekspansi di sekitar mean, saya pikir ini akan sesuai dengan saran bahwa "standar deviasi dari harus cukup kecil dibandingkan dengan rata-rata" yang jawaban saya berakhir dengan - jika saya hilang beberapa masalah lebih lanjut bahwa saran yang tidak mencakup saya harus memperbaiki jawaban saya. a
Glen_b -Reinstate Monica
3
Perkiraan untuk mean berfungsi cukup baik untuk dan untuk varians bekerja cukup baik untuk atau lebih. μ / σ > 2,5μ/σ>1.5μ/σ>2.5
whuber
Dalam hal apa pun, tentu layak untuk diperjelas bahwa kita secara tidak langsung mengandalkan konvergensi (karena ). Terima kasih juga untuk nilai eksplisit yang disarankan; jika ada mungkin saya sedikit terlalu berhati-hati ketika saya menggunakannya. Dua komentar berharga. ln ( μ + y - μ ) = ln [ μ { 1 + ( y - μ ) / μ } ] = ln ( μ ) + ln [ 1 + ( y - μ ) / μ ]ln(1+x)ln(μ+yμ)=ln[μ{1+(yμ)/μ}]=ln(μ)+ln[1+(yμ)/μ]
Glen_b -Reinstate Monica