Ekspektasi akar kuadrat dari jumlah variabel acak seragam kuadrat independen

9

Biarkan menjadi independen dan terdistribusi secara acak, variabel acak seragam standar.X1,,XnU(0,1)

Let Yn=inXi2I seek: E[Yn]


Harapan mudah:Yn

E[X2]=01y2y=13E[Yn]=E[inXi2]=inE[Xi2]=n3

Sekarang untuk bagian yang membosankan. Untuk menerapkan LOTUS, saya akan membutuhkan pdf dari . Tentu saja pdf dari jumlah dua variabel acak independen adalah konvolusi pdf mereka. Namun, di sini kita memiliki variabel acak dan saya kira konvolusi akan mengarah ke ... ekspresi berbelit-belit (kata-kata yang mengerikan dimaksudkan). Apakah ada cara yang lebih pintar?Ynn

Saya lebih suka melihat solusi yang tepat , tetapi jika tidak mungkin atau terlalu rumit, perkiraan asimptotik untuk besar bisa diterima. Dengan ketidaksetaraan Jensen, saya tahu itun

E[Yn]=n3E[Yn]

Tetapi ini tidak banyak membantu saya, kecuali saya dapat menemukan juga batas bawah yang tidak sepele. Perhatikan bahwa CLT tidak secara langsung berlaku di sini, karena kami memiliki akar kuadrat dari jumlah RV independen, bukan hanya jumlah RV independen. Mungkin ada teorema batas lain (yang saya abaikan) yang mungkin bisa membantu di sini.

DeltaIV
sumber
3
Lihat pertanyaan ini untuk hasil asimptotik: stats.stackexchange.com/questions/241504/...
S. Catterall Reinstate Monica
4
Saya mendapatkan berdasarkan pada pertanyaan terkait di atas. E[Yn]n3115
S. Catterall Reinstate Monica
2
Saya tidak berpikir saya akan menggunakan salah satu pendekatan yang dijelaskan dalam jawaban itu (yang ada lebih dari dua!) :-). Alasannya adalah bahwa Anda dapat memanfaatkan simulasi sederhana dan langsung untuk memperkirakan ekspektasi, sementara solusi analitis tampaknya tidak dapat diperoleh. Saya sangat menyukai pendekatan @ S.Catterall (+1 untuk solusi itu, yang belum pernah saya baca sebelumnya). Simulasi menunjukkan itu berfungsi dengan baik bahkan untuk kecil . n
whuber
3
Simulasi ini layak dilakukan :-). Plot perbedaan antara rata-rata yang disimulasikan dan rumus perkiraan terhadap . Ini akan menunjukkan kepada Anda dengan jelas seberapa baik perkiraan bekerja sebagai fungsi dari . nnn
Whuber
4
Jelas sedangkan perkiraan memberi . Dalam hal ini akan benar. Tetapi perkiraan meningkat setelah itu. E[Y1]=0.513115=4150.51613112
Henry

Jawaban:

11

Salah satu pendekatan adalah pertama menghitung fungsi momen menghasilkan (mgf) dari didefinisikan oleh mana adalah independen dan terdistribusi secara seragam, variabel acak seragam standar .YnYn=U12++Un2Ui,i=1,,n

Ketika kita memilikinya, kita dapat melihat bahwa adalah momen pecahan dari dari pesanan . Kemudian kita dapat menggunakan hasil dari makalah Noel Cressie dan Marinus Borkent: "The Moment Generating Function memiliki Moments-nya", Jurnal Perencanaan Statistik dan Inferensi 13 (1986) 337-344, yang memberikan momen pecahan melalui diferensiasi fraksional dari fungsi pembangkit momen .

EYn
Ynα=1/2

Pertama, fungsi penghasil momen , yang kami tulis . dan saya mengevaluasi itu (dengan bantuan Maple dan Wolphram Alpha) untuk memberikan mana adalah unit imajiner. (Wolphram Alpha memberikan jawaban yang sama, tetapi dalam hal integral Dawson. ) Ternyata kita sebagian besar membutuhkan kasus untuk . Sekarang mudah untuk menemukan mgf : Kemudian untuk hasil dari kertas yang dikutip. UntukU12M1(t)

M1(t)=EetU12=01etx2xdx
M1(t)=erf(t)π2t
i=1 t<0YnMn(t)=M1(t)nμ>0μfIμf(t)Γ(μ) - 1 t - (t-z) μ - 1 f(z)t<0Yn
Mn(t)=M1(t)n
μ>0mereka menentukan th rangka integral dari fungsi sebagai Kemudian, untuk dan non-integral, bilangan bulat positif, dan sedemikian rupa sehingga . Kemudian turunan dari of order didefinisikan sebagai Kemudian mereka menyatakan (dan membuktikan) hasil berikut, untuk variabel acak positif : Misalkan (mgf) didefinisikan. Lalu, untukμf
Iμf(t)Γ(μ)1t(tz)μ1f(z)dz
α>0n0<λ<1α=nλfα
Dαf(t)Γ(λ)1t(tz)λ1dnf(z)dzndz.
XMXα>0D α M X ( 0 ) = E X α < Y n α = 1 / 2 E Y 1 / 2 n = D 1 / 2 M n ( 0 ) = Γ ( 1 / 2 ) - 1 0 - | z | , Sekarang kita dapat mencoba menerapkan hasil ini ke . Dengan kita menemukan mana prime menunjukkan turunan. Maple memberikan solusi berikut: Saya akan menunjukkan plot harapan ini, dibuat di maple menggunakan integrasi numerik, bersama dengan solusi perkiraan
DαMX(0)=EXα<
Ynα=1/2
EYn1/2=D1/2Mn(0)=Γ(1/2)10|z|1/2Mn(z)dz
0n(erf(z)π2ezz)en(2ln2+2ln(erf(z))ln(z)+ln(π))22π(z)3/2erf(z)dz
A(n)=n/31/15dari beberapa komentar (dan dibahas dalam jawaban oleh @Henry). Mereka sangat dekat:

Perbandingan tepat dan perkiraan

Sebagai pelengkap, plot kesalahan persentase:

Kesalahan relatif (persen) dalam plot di atas

Di atas sekitar aproksimasi mendekati tepat. Di bawah kode maple yang digunakan:n=20

int( exp(t*x)/(2*sqrt(x)), x=0..1 ) assuming t>0;
int( exp(t*x)/(2*sqrt(x)), x=0..1 ) assuming t<0;
M := t -> erf(sqrt(-t))*sqrt(Pi)/(2*sqrt(-t))
Mn := (t,n) -> exp(n*log(M(t)))
A  :=  n -> sqrt(n/3 - 1/15)
Ex :=  n ->   int( diff(Mn(z,n),z)/(sqrt(abs(z))*GAMMA(1/2) ), z=-infinity..0 ,numeric=true)

plot([Ex(n),A(n)],n=1..100,color=[blue,red],legend=[exact,approx],labels=[n,expectation],title="expectation of sum of squared uniforms")
plot([((A(n)-Ex(n))/Ex(n))*100],n=1..100,color=[blue],labels=[n,"% error"],title="Percentage error of approximation")
kjetil b halvorsen
sumber
1
sangat menarik. Jika Anda dapat menambahkan beberapa plot, ini akan menjadi jawaban yang bagus. Namun, saya akan mencatat satu keuntungan berbeda dari pendekatan CLT di sini. Perkiraan menunjukkan dengan jelas bahwa tumbuh sebagai saat . Solusi Maple tidak (atau setidaknya saya tidak bisa mengetahuinya). E[Yn]nn
DeltaIV
5

Sebagai komentar yang diperluas: tampaknya jelas di sini bahwa dimulai dengan ketika dan kemudian mendekati dengan meningkat, terkait dengan varian jatuh dari menuju . Pertanyaan saya yang ditautkan yang dijawab oleh S.Catterall memberikan justifikasi untuk asymptotic berdasarkan setiap memiliki mean dan variansE[Yn]=E[iXi2]E[Yn]=12=n3112n=1n3115nYn112115n3115Xi213445 , dan untuk distribusinya kira-kira normal dan asimptotik.

Pertanyaan ini secara efektif tentang distribusi jarak dari titik asal acak dalam satuan hipcube -dimensi . Ini mirip dengan pertanyaan tentang distribusi jarak antara titik-titik dalam hypercube , jadi saya dapat dengan mudah menyesuaikan apa yang saya lakukan di sana untuk menunjukkan kepadatan untuk berbagai dari hingga menggunakan konvolusi numerik. Untuk , perkiraan normal yang disarankan berwarna merah cocok, dan dari Anda dapat melihat kurva lonceng muncul. n[0,1]nn116n=16n=4

masukkan deskripsi gambar di sini

Untuk dan Anda mendapatkan puncak yang tajam pada mode dengan apa yang tampak seperti kepadatan yang sama di kedua kasus. Bandingkan ini dengan distribusi , di mana kurva lonceng muncul dengan dan di mana sebanding dengann=2n=31iXin=3n

Henry
sumber
2
Varians yang hampir konstan mengarah pada kemungkinan hasil kontra-intuitif. Misalnya dengan , (jarak dari titik asal dalam dimensi unit hypercube) dapat mengambil nilai dari hingga tetapi dari kasus akan berada di antara dan dan hampir semuanya antara dann=400 40002094%11121013Y40040002094%11121013
Henry
1
sebenarnya agak kontra-intuitif. Karena kutukan dimensi, saya mengharapkan sebagian besar titik dekat dengan sudut (realisasi st ). Sebaliknya sepertinya sebagian besar titik jauh dari titik asal, tetapi tidak sejauh sudut. Mungkin kesalahannya adalah kita harus mempertimbangkan jarak dari pusat hypercube , bukan jarak dari titik asal , yang hanya salah satu sudut hypercube. y400y400=20
DeltaIV
3
@DeltaIV: Jika Anda membuat sisi hypercube jadi dan mengukur dari asalnya, Anda mendapatkan distribusi, harapan, dan varian yang sama persis. Dengan poin terbanyak dalam hypecube yang lebih besar ini akan mendekati batas hypercube ini (jarak tipikal urutan ) tetapi tidak dekat dengan sudut-sudutnya (jarak tipikal ke yang terdekat atau lagi)[ - 1 , 1 ] n n = 400 0,02 11 122[1,1]nn=4000.021112
Henry
1
itu masuk akal - saya tidak punya waktu untuk melakukan matematika, tetapi secara intuitif saya mengharapkan hasil yang sama untuk . Saya mengharapkan ekspektasi (maaf untuk permainan kata-kata) berubah dengan faktor konstan, tetapi seperti yang saya katakan saya tidak punya waktu untuk memeriksanya. U([1,1])
DeltaIV