Berapa banyak istilah terbesar dalam

11

Pertimbangkan i=1N|Xi| di mana X1,,XN adalah id dan CLT berlaku.
Berapa banyak istilah terbesar yang menambahkan hingga setengah jumlah total?
Misalnya, 10 + 9 + 8 (10 + 9 + 8 + 1) / 2: 30% dari persyaratan mencapai sekitar setengah dari total.

Menetapkan
sumbiggest( j;X1XN)sum of the j biggest of |X1||XN|
halfsum(N)the smallest j such that sumbiggest( j )sumbiggest(N)/2.

Apakah ada hasil asimptotik umum untuk halfsum ( N,μ,σ )?
Derivasi yang sederhana dan intuitif akan menyenangkan.

(Sedikit Monte Carlo menunjukkan bahwa kadang-kadang halfsum ( N ) N / 4 atau lebih;
yaitu, 1/4 terbesar dari Xi tambahkan hingga 1/2 total.
Saya mendapatkan 0,24 N untuk setengah normal, 0,19 N untuk eksponensial, untuk N = 20, 50, 100.)

denis
sumber
3
Jangan mengharapkan hasil universal seperti CLT. Misalnya, jawaban untuk varian seragam (0,1) akan sangat berbeda dari jawaban untuk varian seragam (1000,1001)!
whuber
Benar, halfsum tentu saja akan tergantung pada mean dan sd. Tapi mengapa ~ N / 5 untuk eksponensial?
denis
2
Asimtotik, Denis, cutoff untuk halfsum akan menjadi nilai yang x 0 t f ( t ) d t = 1 / 2 dimana f adalah pdf untuk | X i | ; pertanyaannya menanyakan N ( 1 - F ( x ) ) ( F adalah cdf untuk | X i | ). Dalam hal seragam [ 0 , 1 ]x0xtf(t)dt=1/2f|Xi|N(1F(x))F|Xi|[0,1]distribusi Anda mendapatkan jawaban @ Dilip; untuk eksponensial, . x0.186682NN/5
whuber

Jawaban:

2

Tidak, tidak ada hasil asimptotik umum. Biarkan menjadi urutan x i , di mana x [ 1 ] adalah yang terbesar.x[1]x[N]xix[1]

Perhatikan dua contoh berikut:

1) . Jelas bahwa CLT berlaku. Anda hanya perlu M = 1 observasi untuk M j = 1 | x [ j ] | 1P(x=0)=1M=1. j=1M|x[j]|12N|xi|

P(x=1)=1M=N/2j=1M|x[j]|12N|xi|

Sebagai contoh nontrivial, distribusi Bernoulli:

P(x=1)=p, P(x=0)=1ppN/2p

Jbowman
sumber
4
0N/2x[i]
1

Xi[0,1]iXiN/2N/2XN/4NNU[0,1]01x0<x<1(1x)Nx1(1+x)/2(1x)N(1+x)/2)=(1x2)N/2N/4x1/2(11/2)N0.3NN/4

iXi=YYx(1x2)N/2=Y/2YN/2N/12Yx=1(Y/N)YY=0Y=N

Dilip Sarwate
sumber
(0,1)1(0,)Y1,Y2,,Yn+1Y ( 1 ) , Y ( 2 ) , , Y ( n ) ( 0 , α )Ymax=α Y(1),Y(2),,Y(n)didistribusikan secara seragam dalam . Lihat, misalnya, pertanyaan dan jawaban ini di situs pendamping math.SE. (lanjutan)(0,α)
Dilip Sarwate
Bagaimanapun, argumen saya tidak menggunakan jarak antara sampel yang dipesan dari distribusi seragam.
Dilip Sarwate
Anda benar, saya salah paham dengan Anda. Sebagai pertanyaan sampingan, bukankah potongan antara titik seragam-acak didistribusikan secara eksponensial, setelah penskalaan - kebalikan dari q + a Anda? [Patah Tongkat Aturan dari Proyek Demonstrasi Wolfram] ( demonstrations.wolfram.com/BrokenStickRule ) pasti terlihat eksponensial, pasti ada yang mudah? bukti.
denis
Silakan ajukan pertanyaan sampingan Anda sebagai pertanyaan terpisah.
Dilip Sarwate
Mulai, lalu lihat probabilitas-distribusi-panjang-fragmen , Anda bisa berkomentar di sana.
denis
0

Mari kita asumsikan X hanya memiliki nilai positif untuk menghilangkan nilai absolut.

Tanpa bukti yang pasti, saya pikir Anda harus menyelesaikannya untuk k

(1FX(k))E(X|X>=k)=12E(X) dengan F menjadi fungsi distribusi kumulatif untuk X

dan kemudian jawabannya diberikan dengan mengambil nilai tertinggi.n(1FX(k))

Logika saya adalah bahwa asymtopically jumlah semua nilai yang lebih tinggi dari k seharusnya

n(1FX(k))E(X|X>=k)

dan setengah dari jumlah total adalah sekitar

12nE(X) .

Simulasi numerik menunjukkan bahwa hasilnya berlaku untuk kasus seragam (seragam dalam ) di mana dan saya mendapatkan . Saya tidak yakin apakah hasilnya selalu bertahan atau apakah bisa disederhanakan lebih lanjut, tapi saya pikir itu sangat tergantung pada fungsi distribusi F.F ( k ) = k k = [0,1]F(k)=kk=(12)

Erik
sumber