Batas ekor pada norma Euclidean untuk distribusi seragam pada

11

Apa yang diketahui batas atas pada seberapa sering norma Euclidean dari elemen yang dipilih secara seragam dari akan lebih besar dari ambang yang diberikan?{n, (n1), ..., n1, n}d

Saya terutama tertarik pada batas yang konvergen secara eksponensial ke nol ketika jauh lebih kecil dari .dnd

Ricky Demer
sumber
Hal ini mudah untuk jawaban untuk ambang --you're hanya komputasi volume hyperspheres - tetapi lebih sulit untuk bekerja keluar untuk . Apakah Anda berada dalam salah satu situasi itu? t > ntnt>n
whuber
3
Saya membutuhkan. t>n
Ricky Demer
1
Saya tidak punya waktu untuk memposting jawaban terperinci saat ini, tetapi ini adalah petunjuk untuk saat ini: Bandingkan dengan variabel acak binomial dengan rata-rata yang sama dengan menggunakan teknik ikatan Chernoff standar. Ini akan menghasilkan batasan bentuk untuk dan disediakan yang masuk akal setelah Anda berpikir tentang apa arti dari jarak Euclidean kuadrat adalah. Semoga itu bisa membantu. a d e - b t 2 a b t > n k(Xk/n)2adebt2abt>nd(n+1)/3n
kardinal

Jawaban:

1

Secara intuitif, harus jelas bahwa titik yang koordinat sampelnya secara acak dari distribusi seragam harus memiliki modulus kecil karena kutukan dimensi. Ketika meningkat, probabilitas bahwa titik sampel secara acak dari volume bola satuan dimensi akan memiliki jarak kurang dari atau sama dengan dari pusat adalah , yang turun secara eksponensial cepat.d ϵ ϵ dddϵϵd

Saya akan memberikan versi lengkap dari solusi kardinal.

Biarkan menjadi satu salinan independen dari diskrit, distribusi seragam di atas bilangan bulat . Jelas, , dan mudah dihitung bahwa - n k n E [ X ] = 0 Var ( X i ) = n ( n + 1 )XinknE[X]=0Var(Xi)=n(n+1)3

Ingat bahwa dan itu Var ( X 2 i ) = E [ X 4 i ] - E [ X 2 i ] 2E[Xi2]=Var(Xi)+E[Xi]2Var(Xi2)=E[Xi4]E[Xi2]2

Dengan demikian,E[Xi2]=Var(Xi)=n(n+1)3

Var(Xi2)=E[Xi4]E[Xi2]2=n(n+1)(3n2+3n+1)15(n(n+1)3)2

E[Xi4] perhitungan

BiarkanYi=Xi2

i=1dYi=(Distance of Randomly Sampled Point to Origin)2

Saya akan menyelesaikan ini besok, tetapi Anda dapat melihat bahwa variabel ini memiliki rata-rata sekitar , sementara kurang dari pecahan poin memiliki jarak kurang dari setengah jarak maksimum 2-ddn2n232ddn22

Michael K.
sumber
0

Jika semua mengikuti seragam diskrit independen di atas , maka karena ada nilai yang dapat dipilih dan rata-ratanya adalah 0, kami memiliki untuk semua : [ - n , n ] 2 n + 1 iXi[n,n]2n+1i

E(Xi)=0 , dan

V(Xi)=E((XiE(Xi))2)=E(Xi2)=(2n+1)2112=n(n+1)3

Maka jika adalah norma vektor , dan karena independensi :( X 1 , X 2 , . . . X d ) X iS(X1,X2,...Xd)Xi

S=i=1dXi2

E(S)=i=1dE(Xi2)=dn(n+1)3

Dari sini Anda dapat menggunakan ketidaksetaraan Markov:a>0,P(Sa)1aE(S)

P(Sa)dan(n+1)3

Batas ini naik dengan , yang normal karena ketika semakin besar norma euclidean semakin besar jika dibandingkan dengan ambang batas tetap .d adda

Sekarang jika Anda mendefinisikan sebagai norma kuadrat "dinormalisasi" (yang memiliki nilai harapan yang sama tidak peduli seberapa besar ) Anda dapatkan: dSd

S=1dY=1di=1dXi2

E(S)=n(n+1)3

P(Sa)n(n+1)3a

Setidaknya batas ini tidak naik dengan , tetapi masih jauh dari menyelesaikan pencarian Anda untuk batas yang menurun secara eksponensial! Saya bertanya-tanya apakah ini bisa disebabkan oleh kelemahan ketimpangan Markov ...d

Saya pikir Anda harus tepat pertanyaan Anda, karena seperti yang dinyatakan di atas rata-rata norma euclidean vektor Anda naik secara linear dalam , jadi Anda sangat tidak mungkin menemukan batas atas untuk yang menurun dalam dengan ambang batas tetap .P ( S > a ) d adP(S>a)da

Jubo
sumber