Generalisasi Hukum Harapan Iterated

43

Saya baru-baru ini menemukan identitas ini:

E[E(Y|X,Z)|X]=E[Y|X]

Saya tentu saja akrab dengan versi sederhana dari aturan itu, yaitu bahwa tetapi saya tidak dapat menemukan pembenaran untuk generalisasi.E[E(Y|X)]=E(Y)

Saya akan berterima kasih jika seseorang dapat mengarahkan saya ke referensi yang tidak terlalu teknis untuk fakta itu atau, lebih baik lagi, jika seseorang dapat memberikan bukti sederhana untuk hasil penting ini.

JohnK
sumber
2
Jika y sendiri dikondisikan pada beberapa x maka tidakkah ini akan jatuh keluar dari versi yang lebih sederhana?
Mehrdad

Jawaban:

36

PENGOBATAN INFORMAL

Kita harus ingat bahwa notasi di mana kita mengkondisikan pada variabel acak tidak akurat, meskipun ekonomis, sebagai notasi. Pada kenyataannya kita mengkondisikan pada sigma-aljabar yang dihasilkan oleh variabel-variabel acak ini. Dengan kata lain dimaksudkan untuk berarti . Pernyataan ini mungkin tampak tidak pada tempatnya dalam "Perawatan Informal", tetapi mengingatkan kita bahwa entitas pengkondisian kita adalah kumpulan set (dan ketika kita mengkondisikan pada nilai tunggal, maka ini adalah set tunggal). Dan apa isi set ini? Mereka berisi informasi dengan yang nilai yang mungkin dari variabel acak memasok kami tentang apa yang mungkin terjadi dengan realisasi .E[YX]E[Yσ(X)]XY
Membawa konsep Informasi, memungkinkan kita untuk memikirkan (dan menggunakan) Hukum Ekspektasi Iterasi (kadang-kadang disebut "Properti Menara") dengan cara yang sangat intuitif:
Aljabar-sigma yang dihasilkan oleh dua variabel acak, setidaknya sama sebesar yang dihasilkan oleh satu variabel acak: dalam makna set-theoretic yang tepat. Jadi informasi tentang terkandung dalam setidaknya sama besar dengan informasi yang sesuai dalam . Sekarang, sebagai sindiran notasi, atur dan . Maka LHS dari persamaan yang kita lihat, dapat ditulisσ(X)σ(X,Z)σ ( X , Z ) σ ( X ) σ ( X ) I x σ ( X , Z ) I x zYσ(X,Z)σ(X)
σ(X)Ixσ(X,Z)Ixz

Y I x z I x

E[E(Y|Ixz)|Ix]
Menggambarkan secara verbal ungkapan di atas yang kita miliki: "apa harapan dari {nilai yang diharapkan dari diberikan Informasi } mengingat bahwa kita memiliki informasi yang tersedia hanya ?" YIxzIx

Bisakah kita "mempertimbangkan" ? Tidak - kami hanya tahu . Tetapi jika kita menggunakan apa yang kita miliki (karena kita diwajibkan oleh ungkapan yang ingin kita selesaikan), maka pada dasarnya kita mengatakan hal-hal tentang bawah operator ekspektasi, yaitu kita mengatakan " ", tidak lebih - kami baru saja kehabisan informasi. I x Y E ( Y I x )IxzIxYE(YIx)

Karenanya

E[E(Y|Ixz)|Ix]=E(Y|Ix)

Jika orang lain tidak, saya akan kembali untuk perawatan formal.

A (sedikit lebih) PENGOBATAN FORMAL

Mari kita lihat bagaimana dua buku yang sangat penting dari teori probabilitas, P. Billingsley's Probability and Measure (3d ed.-1995) dan D. Williams "Probability with Martingales" (1991), membahas masalah membuktikan "Law Of Iterated Expectations":
Billingsley mencurahkan tiga baris untuk bukti. Williams, dan saya kutip, kata

"(Properti Menara) hampir langsung dari definisi harapan bersyarat".

Itu satu baris teks. Bukti Billingsley tidak kalah buram.

Mereka tentu saja benar: sifat penting dan sangat intuitif dari ekspektasi kondisional ini pada dasarnya berasal langsung (dan hampir segera) dari definisi-satu-satunya masalah adalah, saya menduga bahwa definisi ini biasanya tidak diajarkan, atau setidaknya tidak disorot, di luar probabilitas atau mengukur lingkaran teoretis. Tetapi untuk menunjukkan dalam (hampir) tiga baris yang dipegang oleh Hukum Ekspektasi Iterasi, kita membutuhkan definisi ekspektasi bersyarat, atau lebih tepatnya, properti pendefinisiannya .

Biarkan ruang probabilitas , dan variabel acak terintegral . Mari menjadi sub -algebra dari , . Kemudian ada fungsi yang -terukur, dapat diintegrasikan dan (ini adalah properti yang menentukan)Y G σ F GF W G(Ω,F,P)YGσFGFWG

E(W1G)=E(Y1G)GG[1]

di mana adalah fungsi indikator dari himpunan . Kita mengatakan bahwa adalah ("versi") ekspektasi bersyarat dari diberikan , dan kami menulis detail penting untuk dicatat di sini adalah bahwa ekspektasi bersyarat itu adalah , memiliki nilai yang diharapkan sama dengan tidak, bukan hanya seluruh , namun di setiap bagian dari . G W Y G W = E ( Y G )1GGWYGY G G GW=E(YG)a.s.
YGGG

(Saya akan mencoba sekarang untuk menyajikan bagaimana properti Tower berasal dari definisi ekspektasi bersyarat).

G σ HG G HG G W H U = E ( W H )W adalah variabel acak -terukur. Pertimbangkan kemudian beberapa sub -algebra, mengatakan . Kemudian . Jadi, secara analog seperti sebelumnya, kita memiliki harapan bersyarat dari diberikan , katakanlah yang dicirikan oleh GσHGGHGGWHU=E(WH)a.s.

E(U1G)=E(W1G)GH[2]

Karena , persamaan dan memberi kitaHG[1][2]

E(U1G)=E(Y1G)GH[3]

Tapi ini adalah milik mendefinisikan ekspektasi bersyarat dari diberikan . YHJadi kita berhak menulis Karena kita juga memiliki konstruksi , kami baru saja membuktikan properti Tower, atau bentuk umum dari Hukum Harapan Berulang - dalam delapan baris.U=E(YH)a.s.
U=E(WH)=E(E[YG]H)

Alecos Papadopoulos
sumber
6
(+1) Ini adalah cara yang bermanfaat untuk menggambarkan konsep yang abstrak dan sulit. Saya percaya, bahwa frasa "... tidak lebih besar ..." harus "tidak lebih kecil." Lebih baik lagi, bagian itu dapat dibuat lebih jelas dengan menghilangkan yang negatif dan menggunakan konstruksi paralel, seperti pada "Aljabar sigma yang dihasilkan oleh dua variabel setidaknya sama besar dengan yang dihasilkan oleh satu variabel acak ... Jadi informasi tentang mengandung di setidaknya sama besarnya dengan informasi yang sesuai di . " Yσ(X,Z)σ(X)
whuber
Terima kasih keduanya, cc @whuber. Ini adalah teorema yang sangat berguna.
JohnK
@ whuber Terima kasih telah melihat ini -dan untuk sarannya.
Alecos Papadopoulos
24

Cara saya memahami harapan bersyarat dan mengajar siswa saya adalah sebagai berikut:

harapan bersyarat adalah gambar yang diambil oleh kamera dengan resolusiE[Y|σ(X)]σ(X)

Seperti yang disebutkan oleh Alecos Papadopoulos, notasi lebih tepat daripada . Sepanjang garis kamera, orang dapat menganggap sebagai objek asli, misalnya, lanskap, pemandangan. adalah gambar yang diambil oleh kamera dengan resolusi . Ekspektasi adalah operator rata-rata (operator "kabur"?). Scenary mungkin berisi banyak hal, tetapi gambar yang Anda ambil menggunakan kamera dengan resolusi rendah tentu akan membuat beberapa detail hilang, misalnya, mungkin ada UFO di langit yang dapat dilihat oleh mata telanjang Anda tetapi tidak muncul di gambar yang diambil oleh (iphone 3?)E[Y|σ(X)]E[Y|X]YE[Y|σ(X,Z)]σ(X,Z)

Jika resolusinya sangat tinggi sehingga , maka gambar ini dapat menangkap setiap detail pemandangan nyata. Dalam hal ini, kita memiliki .σ(X,Z)=σ(Y)E[Y|σ(Y)]=Y

Sekarang, dapat dilihat sebagai: menggunakan kamera lain dengan resolusi (misalnya, iphone 1) yang lebih rendah dari (mis., Iphone 3) dan mengambil gambar pada gambar yang dihasilkan oleh kamera dengan resolusi , maka harus jelas bahwa gambar ini pada gambar harus sama seperti jika Anda awalnya cukup gunakan kamera dengan resolusi rendah pada pemandangan.E[E[Y|σ(X,Z)]|σ(X)]σ(X)σ(X,Z)σ(X,Z)σ(X)

Ini memberikan intuisi pada . Bahkan intuisi yang sama ini memberi tahu kita bahwa masih. Ini karena: jika foto pertama Anda diambil oleh iphone 1 (yaitu, resolusi rendah), dan sekarang Anda ingin menggunakan kamera yang lebih baik (misalnya, iphone 3) untuk menghasilkan foto lain pada foto pertama, maka tidak mungkin Anda dapat meningkatkan kualitas foto pertama.E [ E [ Y | X ] | X , Z ] = E [ Y | X ]E[E[Y|X,Z]|X]=E[Y|X]E[E[Y|X]|X,Z]=E[Y|X]

KevinKim
sumber
2
suka! :) penjelasan yang bagus.
jessica
1
@ jessica Saya senang ini membantu :-) Butuh beberapa saat untuk membuat penjelasan ini
KevinKim
21

Dalam Law of Iterated Expectation (LIE), , bahwa ekspektasi batin adalah variabel acak yang kebetulan merupakan fungsi , katakanlah , dan bukan merupakan fungsi dari . Bahwa ekspektasi fungsi terjadi sama dengan ekspektasi adalah konsekuensi dari KEBOHONGAN. Semua ini, secara lamban, hanyalah pernyataan bahwa nilai rata-rata dapat ditemukan dengan rata -rata nilai rata-rata dalam berbagai kondisi. Akibatnya, itu semua hanyalah konsekuensi langsung dari hukum probabilitas total. Misalnya, jika danE[E[YX]]=E[Y]Xg(X)YXYYYXY adalah variabel acak diskrit dengan PMF p_ , lalu \ scriptstyle {\ text {RV} ~ E [Y \ mid X] ~ \ text {memiliki nilai} ~ E [Y \ mid X = x] ~ \ text {when} ~ X = x} \ end {align} Pemberitahuan bagaimana harapan terakhir itu berkenaan dengan ;pX,Y(x,y)

E[Y]=yypY(y)definition=yyxpX,Y(x,y)write in terms of joint pmf=yyxpYX(yX=x)pX(x)write in terms of conditional pmf=xpX(x)yypYX(yX=x)interchange order of summation=xpX(x)E[YX=x]inner sum is conditional expectation=E[E[YX]]RV E[YX] has value E[YX=x] when X=x
XE[YX] adalah fungsi dari , bukan dari , namun demikian rata adalah sama dengan rata-rata .XYY

LIE umum yang Anda lihat ada di sebelah kiri di mana harapan batin adalah fungsi dari dua variabel acak dan . Argumennya mirip dengan yang diuraikan di atas tetapi sekarang kita harus menunjukkan bahwa variabel acak sama dengan variabel acak lainnya. Kami melakukan ini dengan melihat nilai ketika memiliki nilai . Melompati penjelasan, kita punya itu E[E[YX,Z]X]h(X,Z)XZ E[YX]E[YX]Xx

E[YX=x]=yypYX(yX=x)=yypX,Y(x,y)pX(x)=yyzpX,Y,Z(x,y,z)pX(x)=yyzpYX,Z(yX=x,Z=z)pX,Z(x,z)pX(x)=zpX,Z(x,z)pX(x)yypYX,Z(yX=x,Z=z)=zpZX(zX=x)yypYX,Z(yX=x,Z=z)=zpZX(zX=x)E[YX=x,Z=z)=E[E[YX,Z]X=x]
Perhatikan bahwa sisi kanan kedua dari belakang adalah rumus untuk nilai yang diharapkan bersyarat dari variabel acakZ] (fungsi dan ) dikondisikanE[YX,Z]XZpada nilai . Kami memperbaiki untuk memiliki nilai , mengalikan nilai dari variabel acak dengan nilai PMF bersyarat dari diberikan , dan menjumlahkan semua istilah tersebut.XXxE[YX,Z]ZX

Dengan demikian, untuk setiap nilai dari variabel acak , nilai variabel acak (yang kami catat sebelumnya adalah fungsi , bukan ), sama dengan nilai acak variabel , yaitu, kedua variabel acak ini sama. Apakah saya akan berbohong kepada Anda?X E [ Y X ] X Y E [ E [ Y X , Z ] X ]xXE[YX]XYE[E[YX,Z]X]

Dilip Sarwate
sumber