Nilai yang diharapkan dari x dalam distribusi normal, DIBERIKAN bahwa itu di bawah nilai tertentu

12

Hanya ingin tahu apakah mungkin untuk menemukan nilai yang diharapkan dari x jika terdistribusi secara normal, mengingat bahwa itu di bawah nilai tertentu (misalnya, di bawah nilai rata-rata).

Melati
sumber
Tentu saja mungkin. Minimal Anda dapat menghitung dengan brute force . Atau jika Anda tahu dan Anda dapat memperkirakannya menggunakan simulasi. F(t)1xtf(t)dtμσ
dsaxton
@dsaxton Ada beberapa kesalahan ketik dalam rumus itu, tetapi kami mendapatkan idenya. Yang saya ingin tahu adalah bagaimana tepatnya Anda menjalankan simulasi ketika ambang jauh di bawah rata-rata.
whuber
1
@whuber Ya, harus . Tidak akan terlalu pintar untuk melakukan simulasi ketika mendekati nol, tetapi ketika Anda menunjukkan ada rumus yang tepat. F(t)F(x)F(x)
dsaxton
@ Maxton OK, cukup adil. Saya hanya berharap Anda memiliki semacam ide cerdas dan sederhana untuk disimulasikan dari ekor distribusi normal.
whuber
Pertanyaan yang kurang lebih sama di Math.SE: math.stackexchange.com/questions/749664/average-iq-of-mensa
JiK

Jawaban:

18

Variabel terdistribusi normal dengan mean dan varians memiliki distribusi yang sama dengan mana adalah variabel normal standar. Yang perlu Anda ketahui tentang adalah ituμ σ 2 σ Z + μ Z ZXμσ2σZ+μZZ

  • fungsi distribusi kumulatifnya disebut ,Φ
  • ia memiliki fungsi kepadatan probabilitas , dan ituϕ(z)=Φ(z)
  • ϕ(z)=zϕ(z) .

Dua peluru pertama hanyalah notasi dan definisi: yang ketiga adalah satu-satunya properti khusus dari distribusi normal yang kita perlukan.

Biarkan "nilai tertentu" menjadi . Mengantisipasi perubahan dari ke , tentukanX ZTXZ

t=(Tμ)/σ,

maka

Pr(XT)=Pr(Zt)=Φ(t).

Kemudian, dimulai dengan definisi ekspektasi bersyarat kita dapat mengeksploitasi linearitasnya untuk diperoleh

E(X|XT)=E(σZ+μ|Zt)=σE(Z|Zt)+μE(1|Zt)=(σtzϕ(z)dz+μtϕ(z)dz)/Pr(Zt)=(σtϕ(z)dz+μtΦ(z)dz)/Φ(t).

Teorema Dasar Kalkulus menegaskan bahwa setiap integral dari turunan ditemukan dengan mengevaluasi fungsi pada titik akhir: . Ini berlaku untuk kedua integral. Karena dan harus menghilang pada , kami memperolehabF(z)dz=F(b)F(a)Φϕ

E(X|XT)=μσϕ(t)Φ(t).

Ini adalah rata-rata asli dikurangi istilah koreksi yang proporsional dengan Inverse Mills Ratio .

! [gambar: plot rasio Mills terbalik

Seperti yang kita harapkan, rasio Mills terbalik untuk harus positif dan melebihi (yang grafiknya ditunjukkan dengan garis merah bertitik). Itu harus menyusut ke saat tumbuh besar, untuk kemudian pemotongan pada (atau ) hampir tidak berubah. Ketika tumbuh sangat negatif, rasio Mills terbalik harus mendekati karena ekor dari distribusi normal berkurang begitu cepat sehingga hampir semua probabilitas di ekor kiri terkonsentrasi di dekat sisi kanannya (pada ).tt0tZ=tX=Tttt

Akhirnya, ketika berada di mean, mana Rasio Mills terbalik sama dengan . Ini menyiratkan nilai yang diharapkan dari , terpotong pada rata-rata (yang merupakan negatif dari distribusi setengah normal ), adalah kali standar deviasi di bawah rata-rata aslinya.T=μt=02/π0.797885X2/π

whuber
sumber
6

Secara umum, biarkan memiliki fungsi distribusi .XF(X)

Kami memiliki, untuk , Anda dapat memperoleh kasus khusus dengan mengambil, misalnya , yang menghasilkan .x[c1,c2]

P(Xx|c1Xc2)=P(Xxc1Xc2)P(c1Xc2)=P(c1Xx)P(c1Xc2)=F(x)F(c1)F(c2)F(c1)
c1=F(c1)=0

Menggunakan cdf kondisional, Anda mungkin mendapatkan kepadatan bersyarat (misalnya, untuk ), yang dapat digunakan untuk ekspektasi bersyarat.f(x|X<0)=2ϕ(x)XN(0,1)

Dalam contoh Anda, integrasi dengan bagian memberi seperti pada jawaban @ whuber.

E(X|X<0)=20xϕ(x)=2ϕ(0),
Christoph Hanck
sumber
+1 (entah bagaimana saya melewatkan ini ketika pertama kali muncul). Bagian pertama adalah akun yang sangat baik tentang cara mendapatkan fungsi distribusi terpotong dan yang kedua menunjukkan cara menghitung PDF mereka.
whuber