Mengapa jumlah variabel seragam kontinu pada (0,1) yang diperlukan untuk jumlah mereka melebihi satu memiliki rata-rata ?

14

Mari kita menjumlahkan aliran variabel acak, ; misalkan adalah jumlah istilah yang kita perlukan untuk totalnya melebihi satu, yaitu adalah angka terkecil sehinggaY YXiiidU(0,1)YY

X1+X2++XY>1.

Mengapa mean dari sama Euler konstan ?eYe

E(Y)=e=10!+11!+12!+13!+
Gegat
sumber
Saya memposting ini dalam semangat pertanyaan belajar mandiri, meskipun saya pikir saya pertama kali melihat pertanyaan ini lebih dari satu dekade yang lalu. Saya tidak ingat bagaimana saya menjawabnya saat itu, meskipun saya yakin itu tidak muncul ketika saya melihat properti ini disebutkan di utas Perkiraan menggunakan Simulasi Monte Carloe . Karena saya menduga ini adalah pertanyaan latihan yang cukup umum, saya telah memilih untuk menyajikan sketsa daripada solusi lengkap, meskipun saya kira "peringatan spoiler" utama termasuk dalam pertanyaan itu sendiri!
Silverfish
Saya tetap sangat tertarik dengan pendekatan alternatif; Saya tahu ini dimasukkan sebagai pertanyaan dalam Teori Probabilitas Gnedenko (aslinya dalam bahasa Rusia tetapi diterjemahkan secara luas) tetapi saya tidak tahu solusi apa yang diharapkan di sana, atau diajukan di tempat lain.
Silverfish
1
Saya menulis solusi simulasi di MATLAB menggunakan metode simpleks Anda. Saya tidak tahu tentang tautan ke simpleks, ini sangat tidak terduga.
Aksakal

Jawaban:

14

Pengamatan pertama: Y memiliki CDF yang lebih menyenangkan daripada PMF

Fungsi massa probabilitas pY(n) adalah probabilitas bahwa n adalah "cukup" untuk total melebihi kesatuan, yaitu X1+X2+Xn melebihi satu sedangkan X1++Xn1 tidak tidak.

Distribusi kumulatif FY(n)=Pr(Yn) hanya membutuhkan n adalah "cukup", yaitu i=1nXi>1 tanpa batasan berapa banyak oleh. Ini terlihat seperti peristiwa yang jauh lebih sederhana untuk menghadapi probabilitas.

Pengamatan kedua: Y mengambil nilai integer non-negatif sehingga E(Y) dapat ditulis dalam bentuk CDF

Jelas Y hanya dapat mengambil nilai dalam {0,1,2,} , sehingga kita dapat menulis mean dalam hal CDF pelengkap , F¯Y .

E(Y)=n=0F¯Y(n)=n=0(1FY(n))

Faktanya Pr(Y=0) dan Pr(Y=1) sama-sama nol, jadi dua istilah pertama adalah E(Y)=1+1+ .

Adapun persyaratan kemudian, jika FY(n) adalah probabilitas bahwa i=1nXi>1 , apa acara adalah F¯Y(n) probabilitas?

Pengamatan ketiga: volume (hiper) dari n simpleks adalah 1n!

The n -simplex ada di benak saya menempati volume bawah standar unit (n1) -simplex di semua positif orthant dari Rn : itu adalah convex hull dari (n+1) simpul, khususnya asal ditambah simpul dari unit (n1) -simplex at (1,0,0,) , (0,1,0,) dll.

volumes of 2-simplex and 3-simplex

Misalnya, 2-simpleks di atas dengan memiliki luas 1x1+x21 dan 3-simpleks denganx1+x2+x31memiliki volume112x1+x2+x31 .16

Untuk bukti yang dihasilkan dengan langsung mengevaluasi integral untuk probabilitas acara yang dijelaskan oleh , dan tautan ke dua argumen lain, lihat utas Matematika SE ini . Thread terkait juga mungkin menarik: Apakah ada hubungan antara e dan jumlah volume n- simpleks?F¯Y(n)en

Gegat
sumber
1
Ini adalah pendekatan geometris yang menarik, dan mudah dipecahkan dengan cara ini. Cantik. Inilah persamaan untuk volume simpleks. Saya tidak berpikir mungkin ada solusi yang lebih elegan, terus terang
Aksakal
1
+1 Anda juga dapat memperoleh distribusi penuh dari salah satu pendekatan di pos saya di stats.stackexchange.com/questions/41467/… . Y
whuber
Jika saya menemukan solusi ini, tidak mungkin mereka memaksa saya melakukannya dengan cara lain di sekolah :)
Aksakal
11

Perbaiki . Biarkan U i = X 1 + X 2 + + X in1 menjadi bagian pecahan dari jumlah parsial untuk i = 1 , 2 , , n . Keseragaman independen dari X 1 dan X i + 1 menjamin bahwa U i + 1 kemungkinan akan melebihi U i karena lebih kecil dari itu. Ini menyiratkan bahwasemua n ! orderings urutan ( U i ) sama-sama mungkin.

Ui=X1+X2++Ximod1
i=1,2,,nX1Xi+1Ui+1Uin!(Ui)

Dengan urutan , kita dapat memulihkan urutan X 1 , X 2 , ... , X n . Untuk melihat caranya, perhatikan ituU1,U2,,UnX1,X2,,Xn

  • karena keduanya antara 0 dan 1 .U1=X101

  • Jika , maka X i + 1 = U i + 1 - U i .Ui+1UiXi+1=Ui+1Ui

  • Kalau tidak, , dari mana X i + 1 = U i + 1 - U i + 1 .Ui+Xi+1>1Xi+1=Ui+1Ui+1

Ada tepat satu urutan di mana sudah dalam urutan meningkat, dalam hal ini 1 > U n = X 1 + X 2 + + X n . Menjadi salah satu dari n ! kemungkinan urutan yang sama, ini memiliki peluang 1 / n ! terjadi. Dalam semua urutan lainnya, setidaknya satu langkah dari U i ke U i + 1 rusak. Ini menyiratkan jumlah X saya harus sama atau melebihi 1Ui1>Un=X1+X2++Xnn!1/n!UiUi+1Xi1. Jadi kita melihat itu

Pr(Y>n)=Pr(X1+X2++Xn1)=Pr(X1+X2++Xn<1)=1n!.

Ini menghasilkan probabilitas untuk seluruh distribusi , karena untuk integral n 1Yn1

Pr(Y=n)=Pr(Y>n1)Pr(Y>n)=1(n1)!1n!=n1n!.

Bahkan,

E(Y)=n=0Pr(Y>n)=n=01n!=e,

QED.

whuber
sumber
I have read it a couple of times, and I almost get it... I posted a couple of questions in the Mathematics SE as a result of the e constant computer simulation. I don't know if you saw them. One of them came back before your kind explanation on Tenfold about the ceiling function of the 1/U(0,1) and the Taylor series. The second one was exactly about this topic, never got a response, until now...
Antoni Parellada
here and here.
Antoni Parellada
And could you add the proof with the uniform spacings as well?
Xi'an
@Xi'an Could you indicate more specifically what you mean by "uniform spacings" in this context?
whuber
I am referring to your Poisson process simulation via the uniform spacing, in the thread Approximate e using Monte Carlo Simulation for which I cannot get a full derivation.
Xi'an
6

In Sheldon Ross' A First Course in Probability there is an easy to follow proof:

Modifying a bit the notation in the OP, UiiidU(0,1) and Y the minimum number of terms for U1+U2++UY>1, or expressed differently:

Y=min{n:i=1nUi>1}

If instead we looked for:

Y(u)=min{n:i=1nUi>u}
for u[0,1], we define the f(u)=E[Y(u)], expressing the expectation for the number of realizations of uniform draws that will exceed u when added.

We can apply the following general properties for continuous variables:

E[X]=E[E[X|Y]]=E[X|Y=y]fY(y)dy

to express f(u) conditionally on the outcome of the first uniform, and getting a manageable equation thanks to the pdf of XU(0,1), fY(y)=1. This would be it:

(1)f(u)=01E[Y(u)|U1=x]dx

If the U1=x we are conditioning on is greater than u, i.e. x>u, E[Y(u)|U1=x]=1. If, on the other hand, x<u, E[Y(u)|U1=x]=1+f(ux), because we already have drawn 1 uniform random, and we still have the difference between x and u to cover. Going back to equation (1):

f(u)=1+0xf(ux)dx
, and with substituting w=ux we would have f(u)=1+0xf(w)dw.

If we differentiate both sides of this equation, we can see that:

f(u)=f(u)f(u)f(u)=1

with one last integration we get:

log[f(u)]=u+cf(u)=keu

We know that the expectation that drawing a sample from the uniform distribution and surpassing 0 is 1, or f(0)=1. Hence, k=1, and f(u)=eu. Therefore f(1)=e.

Antoni Parellada
sumber
I do like the manner in which this generalises the result.
Silverfish