Ekspektasi produk dari variabel acak dependen saat

18

Mari dan , . Apa harapan sebagai ?X1U[0,1]XsayaU[Xsaya-1,1]saya=2,3,...X1X2Xnn

digunakan oleh siapa
sumber
7
Sebuah komentar pedantic: apakah dimaksudkan untuk berarti ? Atau bisa juga berarti pengkondisian hanya pada , yaitu, . Tetapi karena yang terakhir tidak sepenuhnya menentukan distribusi bersama X_i , tidak segera jelas apakah harapan ditentukan secara unik. XsayaU[Xsaya-1,1]XsayaX1,...,Xsaya-1U[Xsaya-1,1]Xsaya-1XsayaXsaya-1U[Xsaya-1,1]Xsaya
Juho Kokkala
Saya pikir secara teoritis itu harus dikondisikan pada semua X_i sebelumnya Xsayahingga Xsaya-1 . Namun, mengingat Xsaya-1 kita bisa mendapatkan distribusi untuk Xsaya . Jadi saya tidak begitu yakin tentang ini.
siapa
@JuhoKokkala Seperti yang dinyatakan, tidak masalah jika Anda mengkondisikan variabel sebelum Xsaya-1 karena mereka tidak akan mengubah fakta bahwa Xsaya seragam [Xsaya-1,1] . Distribusi (X1,...,Xn) tampaknya sangat jelas bagi saya.
dsaxton
@dsaxton Jika kita hanya menganggap X1U(0,1) dan XiXi1U(Xi1,1),i=2,3,... , itu tetap memungkinkan bahwa X1 dan X3 tidak tergantung pada kondisi X2 . Dengan demikian distribusi (X1,X2,X3) tidak terdefinisi dengan baik.
Juho Kokkala
@JuhoKokkala Jika saya memberi tahu Anda bahwa X2=t , apa distribusi X3 ? Jika Anda dapat menjawab pertanyaan bahkan tanpa memikirkan X1 , bagaimana X1 dan X3 dapat bergantung pada X2 ? Perhatikan juga bagaimana poster lain tidak kesulitan mensimulasikan urutan ini.
dsaxton

Jawaban:

12

Jawabannya memang ,1/e seperti yang ditebak dalam balasan sebelumnya berdasarkan simulasi dan perkiraan terbatas.

Solusinya dengan mudah dicapai dengan memperkenalkan urutan fungsi . Meskipun kami bisa segera melanjutkan ke langkah itu, itu mungkin tampak agak misterius. Bagian pertama dari solusi ini menjelaskan bagaimana orang bisa memasak . Bagian kedua menunjukkan bagaimana mereka dieksploitasi untuk menemukan persamaan fungsional yang dipenuhi oleh fungsi pembatas . Bagian ketiga menampilkan perhitungan (rutin) yang diperlukan untuk menyelesaikan persamaan fungsional ini.f n ( t ) f ( t ) = lim n f n ( t )fn:[0,1][0,1]fn(t)f(t)=limnfn(t)


1. Motivasi

Kita dapat sampai pada hal ini dengan menerapkan beberapa teknik pemecahan masalah matematika standar. Dalam hal ini, di mana beberapa jenis operasi diulangi secara tak terbatas, batas akan ada sebagai titik tetap dari operasi itu. Kuncinya, kemudian, adalah untuk mengidentifikasi operasi.

Kesulitannya adalah perpindahan dari ke terlihat rumit. Lebih mudah untuk melihat langkah ini sebagai yang timbul dari berdampingan ke variabel daripada berdampingan ke variabel . Jika kita menganggap sebagai dibangun seperti yang dijelaskan dalam pertanyaan - dengan didistribusikan secara seragam pada , didistribusikan secara seragam secara kondisional pada , dan seterusnya - kemudian memperkenalkanE [ X 1 X 2X n - 1 X n ] X 1 ( X 2 , , X n ) X n ( X , 1 ]E[X1X2Xn-1]E[X1X2Xn-1Xn]X1(X2,...,Xn)Xn( X 2 ,(X1,X2,...,Xn-1)X 2 [ 0 X 3 [ X 2 , 1 ] X 1 X i 1 - X 1 1(X2,...,Xn)X2[0,1]X3[X2,1]X1akan menyebabkan setiap salah satu berikutnya untuk mengecilkan dengan faktor menuju batas atas . Alasan ini mengarah secara alami ke konstruksi berikut.Xsaya1-X11

Sebagai masalah awal, karena sedikit lebih mudah untuk mengecilkan angka ke daripada menuju , misalkan . Dengan demikian, didistribusikan secara seragam dalam dan didistribusikan secara seragam dalam bersyarat pada untuk semua Kami tertarik pada dua hal:1 Y i = 1 - X i Y 1 [ 0 , 1 ] Y i + 1 [ 0 , Y i ] ( Y 1 , Y 2 , , Y i ) i = 1 , 2 , 3 , .01Ysaya=1-XsayaY1[0,1]Ysaya+1[0,Ysaya](Y1,Y2,,Yi)i=1,2,3,.

  1. Nilai pembatas .E[X1X2Xn]=E[(1Y1)(1Y2)(1Yn)]

  2. Bagaimana nilai-nilai ini berperilaku ketika menyusutkan semua secara seragam menuju : yaitu, dengan menskalakan semuanya dengan beberapa faktor umum , . 0 tYi0t0t1

Untuk tujuan ini, tentukan

fn(t)=E[(1tY1)(1tY2)(1tYn)].

Jelas setiap didefinisikan dan kontinu (benar-benar terdiferensiasi, sebenarnya) untuk semua nyata . Kami akan fokus pada perilaku mereka untuk . t t [ 0 , 1 ]fntt[0,1]


2. Langkah Kunci

Berikut ini jelas:

  1. Setiap adalah fungsi yang menurun secara monoton dari menjadi .[ 0 , 1 ] [ 0 , 1 ]fn(t)[0,1][0,1]

  2. fn(t)>fn+1(t) untuk semua .n

  3. nfn(0)=1 untuk semua .n

  4. E(X1X2Xn)=fn(1).

Ini menyiratkan bahwa ada untuk semua dan .f(t)=limnfn(t)f ( 0 ) = 1t[0,1]f(0)=1

Perhatikan bahwa, tergantung pada , variabel seragam dalam dan variabel (tergantung pada semua variabel sebelumnya) seragam dalam : yaitu , memenuhi persis kondisi yang dipenuhi oleh . Karena ituY 2 / Y 1 [ 0 , 1 ] Y i + 1 / Y 1 [ 0 , Y i / Y 1 ] ( Y 2 / Y 1 , Y 3 / Y 1 , , Y n / Y 1 )Y1Y2/Y1[0,1]Yi+1/Y1[0,Yi/Y1](Y2/Y1,Y3/Y1,,Yn/Y1)(Y1,,Yn1)

fn(t)=E[(1-tY1)E[(1tY2)(1-tYn)|Y1]]=E[(1-tY1)E[(1-tY1Y2Y1)(1-tY1YnY1)|Y1]]=E[(1-tY1)fn-1(tY1)].

Ini adalah hubungan rekursif yang kami cari.

Oleh karena itu dalam batas itu harus menjadi kasus bahwa untuk didistribusikan secara seragam dalam secara independen dari semua ,Y [ 0 , 1 ] Y inY[0,1]Ysaya

f(t)=E[(1-tY)f(tY)]=01(1-ty)f(ty)dy=1t0t(1-x)f(x)dx.

Artinya, harus menjadi titik tetap dari fungsional yang dengannyaLfL.

L.[g](t)=1t0t(1-x)g(x)dx.

3. Perhitungan Solusi

Kosongkan fraksi dengan mengalikan kedua sisi dengan . Karena sisi kanan adalah bagian yang tidak terpisahkan, kita dapat membedakannya sehubungan dengan , memberit t1/ttt

f(t)+tf(t)=(1-t)f(t).

Secara ekuivalen, dengan mengurangkan dan membagi kedua sisi dengan ,tf(t)t

f(t)=-f(t)

untuk . Kami dapat memperpanjang ini dengan kontinuitas untuk memasukkan . Dengan kondisi awal (3) , solusi uniknya adalaht = 0 f ( 0 ) = 10<t1t=0f(0)=1

f(t)=e-t.

Akibatnya, pada (4), harapan membatasi adalah , QED. f ( 1 ) = e - 1 = 1 / eX1X2Xnf(1)=e-1=1/e


Karena Mathematica tampaknya menjadi alat yang populer untuk mempelajari masalah ini, di sini adalah kode Mathematica untuk menghitung dan memplot untuk kecil . Plot menampilkan konvergensi cepat ke (ditampilkan sebagai grafik hitam). n f 1 , f 2 , f 3 , f 4 e - tfnnf1,f2,f3,f4e-t

a = 0 <= t <= 1;
l[g_] := Function[{t}, (1/t) Integrate[(1 - x) g[x], {x, 0, t}, Assumptions -> a]];
f = Evaluate@Through[NestList[l, 1 - #/2 &, 3][t]]
Plot[f, {t,0,1}]

Angka

whuber
sumber
3
(+1) Analisis yang indah.
kardinal
Terima kasih telah berbagi dengan kami. Ada beberapa orang yang benar-benar brilian!
Felipe Gerard
4

Memperbarui

Saya pikir ini adalah taruhan yang aman bahwa jawabannya adalah . Saya menjalankan integral untuk nilai yang diharapkan dari hingga menggunakan Mathematica dan dengan saya dapatkann = 2 n = 1001/en=2n=100n=100

0.367879441171442321595523770161567628159853507344458757185018968311538556667710938369307469618599737077005261635286940285462842065735614

(ke 100 tempat desimal). Kebalikan dari nilai itu adalah

2.718281828459045235360287471351873636852026081893477137766637293458245150821149822195768231483133554

Perbedaannya dengan resiprokal dan adalahe

-7.88860905221011806482437200330334265831479532397772375613947042032873*10^-31

Saya pikir itu terlalu dekat, berani saya katakan, menjadi kebetulan yang rasional.

The Mathematica kode berikut:

Do[
 x = Table[ToExpression["x" <> ToString[i]], {i, n}];
 integrand = Expand[Simplify[(x[[n - 1]]/(1 - x[[n - 1]])) Integrate[x[[n]], {x[[n]], x[[n - 1]], 1}]]];
 Do[
   integrand = Expand[Simplify[x[[i - 1]] Integrate[integrand, {x[[i]], x[[i - 1]], 1}]/(1 - x[[i - 1]])]],
   {i, n - 1, 2, -1}]
  Print[{n, N[Integrate[integrand, {x1, 0, 1}], 100]}],
 {n, 2, 100}]

Akhir pembaruan

Ini lebih merupakan komentar panjang daripada jawaban.

Jika kita menggunakan rute brute force dengan menentukan nilai yang diharapkan untuk beberapa nilai , mungkin seseorang akan mengenali suatu pola dan kemudian dapat mengambil batasan.n

Untuk , kami memiliki nilai yang diharapkan dari produk tersebutn=5

μn=01x11x21x31x41x1x2x3x4x5(1x1)(1x2)(1x3)(1x4)dx5dx4dx3dx2dx1

yaitu 96547/259200 atau sekitar 0,3724807098765432.

Jika kami menghapus integral dari 0 ke 1, kami memiliki polinomial dalam dengan hasil berikut untuk ke (dan saya telah menjatuhkan subskrip untuk membuat hal-hal sedikit lebih mudah dibaca): nx1n = 6n=1n=6

x

(x+x2)/2

(5x+5x2+2x3)/12

(28x+28x2+13x3+3x4)/72

(1631x+1631x2+791x3+231x4+36x5)/4320

(96547x+96547x2+47617x3+14997x4+3132x5+360x6)/259200

Jika seseorang mengenali bentuk koefisien integer, maka mungkin batas sebagai dapat ditentukan (setelah melakukan integrasi dari 0 ke 1 yang dihapus untuk menunjukkan polinomial yang mendasarinya).n

JimB
sumber
1/e sangat elegan! :)
wolfies
4

Pertanyaan yang bagus Sama seperti komentar singkat, saya akan mencatat bahwa:

  • Xn akan konvergen ke 1 dengan cepat, jadi untuk pengecekan Monte Carlo, pengaturan akan lebih dari melakukan trik.n=1000

  • Jika , maka dengan simulasi Monte Carlo, seperti , .Zn=X1X2...XnnE[Zn]0,367

  • Diagram berikut membandingkan pdf simulasi Monte Carlo dari ke distribusi Fungsi Daya [yaitu Beta (a, 1) pdf)]Zn

f(z)=SebuahzSebuah-1

... di sini dengan parameter :Sebuah=0,57


(sumber: tri.org.au )

dimana:

  • kurva biru menunjukkan pdf Monte Carlo 'empiris' dariZn
  • kurva putus-putus merah adalah PowerFunction pdf.

Pas muncul cukup bagus.

Kode

Berikut adalah 1 juta gambar pseudorandom produk (katakanlah dengan ), di sini menggunakan Mathematica :Znn=1000

data = Table[Times @@ NestList[RandomReal[{#, 1}] &, RandomReal[], 1000], {10^6}];

Sampel rata-rata adalah:

 Mean[data]

0,367657

serigala
sumber
dapatkah Anda membagikan seluruh kode Anda? Solusi saya berbeda dari milik Anda.
1
Poin pertama, yang sangat penting, tampaknya tidak cukup dibenarkan. Mengapa Anda dapat mengabaikan efek dari, katakanlah, berikutnya nilai-nilai ? Meskipun konvergensi "cepat", efek kumulatif mereka dapat sangat mengurangi harapan. x n10100xn
whuber
1
Baik penggunaan simulasi di sini. Saya memiliki pertanyaan serupa dengan @whuber. Bagaimana kita bisa yakin nilainya konvergen ke 0,367 tetapi bukan sesuatu yang lebih rendah, yang berpotensi terjadi jika lebih besar? n
siapa
Sebagai balasan atas 2 komentar di atas: (a) Seri konvergen sangat cepat ke 1. Bahkan dimulai dengan nilai awal , dalam waktu sekitar 60 iterasi, akan secara numerik tidak dapat dibedakan dari angka 1,0 ke komputer . Jadi, mensimulasikan dengan adalah berlebihan. (B) Sebagai bagian dari tes Monte Carlo, saya juga memeriksa simulasi yang sama (dengan 1 juta berjalan) tetapi menggunakan daripada 1000, dan hasilnya tidak bisa dibedakan. Dengan demikian, tampaknya tidak mungkin bahwa nilai yang lebih besar akan membuat perbedaan nyata: di atas , secara efektif 1.0.X 1 = 0,1 X 60 X n n = 1000 n = 5000 n n = 100 X nXsayaX1=0,1X60Xnn=1000n=5000nn=100Xn
serigala
0

Murni secara intuitif, dan berdasarkan jawaban Rusty yang lain, saya pikir jawabannya harus seperti ini:

n = 1:1000
x = (1 + (n^2 - 1)/(n^2)) / 2
prod(x)

Yang memberi kita 0.3583668. Untuk setiap , Anda membagi rentang dua, di mana dimulai pada . Jadi ini adalah produk , dll.( a , 1 ) a 0 1 / 2 , ( 1 + 3 / 4 ) / 2 , ( 1 + 8 / 9 ) / 2X(a,1)a01/2,(1+3/4)/2,(1+8/9)/2

Ini hanya intuisi.


Masalah dengan jawaban Rusty adalah bahwa U [1] identik dalam setiap simulasi tunggal. Simulasi tidak independen. Perbaikan untuk ini mudah. Pindahkan garis dengan U[1] = runif(1,0,1)ke dalam lingkaran pertama. Hasilnya adalah:

set.seed(3)    #Just for reproducibility of my solution

n = 1000    #Number of random variables
S = 1000    #Number of Monte Carlo samples

Z = rep(NA,S)
U = rep(NA,n)

for(j in 1:S){
    U[1] = runif(1,0,1)
    for(i in 2:n){
        U[i] = runif(1,U[i-1],1)
    }
    Z[j] = prod(U)
}

mean(Z)

Ini memberi 0.3545284.

Jessica
sumber
1
Memperbaiki yang sangat sederhana! Saya kira itu benar, selalu ada bug dalam kode! Saya akan mencatat jawaban saya.
1
Ya, itulah yang saya harapkan terjadi mengingat Anda memasukkan nilai yang diharapkan sebagai batas bawah.
1
Saya menjalankan kode Anda dengan dan mendapat sebagai jawabannya. Bukankah itu sedikit aneh karena jika itu konvergen ke suatu nilai tidak akan lebih banyak berjalan membuat kita lebih dekat ke nilai itu? 0,3631297S=100000,3631297
siapa