Berapa varians dari maksimum sampel?

13

B

Var(maxiXi)B,
X={X1,,XM}Mμ1,,μMσ12,,σM2

Saya dapat menyimpulkan bahwa tetapi batasan ini tampaknya sangat longgar. Tes numerik tampaknya menunjukkan bahwa mungkin merupakan suatu kemungkinan, tetapi saya belum dapat membuktikannya. Bantuan apa pun dihargai.

Var(maxiXi)iσi2,
B=maxiσi2
Peter
sumber
3
(Apakah Anda ingin menganggap independen?) Dugaan ini masuk akal tetapi tampaknya salah. Misalnya, lakukan beberapa percobaan di mana iid dengan CDF , , . Varians maksimum mereka, relatif terhadap varian umum mereka, meningkat tanpa terikat ketika tumbuh. XiXi1x1s1xs>3M
Whuber
@whuber Terima kasih, itu menjelaskan mengapa saya tidak dapat membuktikan dugaan itu :) Saya memang tertarik pada kasus di mana Xi independen. Hanya untuk memperjelas, saya lebih tertarik pada batasan umum yang hanya menggunakan dua momen pertama. Saya tidak yakin apakah batas umum yang lebih tajam bahkan ada daripada varian umum.
Peter
1
Saya harus menunjukkan bahwa jumlah Anda terikat (dengan asumsi itu benar - akan menyenangkan untuk melihat sketsa buktinya) ketat. Sebagai contoh, misalkan X2,,XM didukung pada interval [,a] dengan varian tidak melebihi ε2 dan biarkan X1 didukung pada [a,] . Kemudian maxiXi=X1 as, dengan varian σ12σ12+(M1)ε2 , tetapi ketidaksetaraan dapat diperketat sebanyak yang Anda suka dengan menyusutε2 .
whuber
1
Untuk data awal, teori nilai ekstrem menyediakan kelas-kelas distribusi tempat sampel maksimum bertemu, dengan kondisi tertentu pada ekor distribusi asli yang memberikan kelas-kelas berbeda dari distribusi asimptotik. Jadi saya ragu bahwa Anda akan dapat memperoleh ikatan yang baik hanya berdasarkan pada dua momen saja, meskipun saya hanya akrab dengan teori.
Tugas

Jawaban:

9

Untuk setiap variabel acak X i , yang terbaik umum terikat adalah V sebuah r ( max X i ) Σ i V sebuah r ( X i ) sebagaimana tercantum dalam pertanyaan awal. Berikut ini adalah sketsa bukti: Jika X, Y adalah IID, maka E [ ( X - Y ) 2 ] = 2 V a r ( X ) . Diberikan vektor variabel yang mungkin tergantung ( X 1 , ...nXiVar(maxXi)iVar(Xi)E[(XY)2]=2Var(X) , misalkan ( Y 1 , ... , Y n ) menjadi vektor independen dengan distribusi gabungan yang sama. Untuk setiap r > 0 , kita memiliki ikatan dengan serikat bahwa P [ | max i X i - max i Y i | 2 > r ] i P [ | X i - Y i | 2 > r ](X1,,Xn)(Y1,,Yn)r>0P[|maxiXimaxiYi|2>r]iP[|XiYi|2>r], Dan mengintegrasikan ini dari 0 ke hasil ketidaksetaraan diklaim.dr0

Jika adalah indikator IID dari peristiwa probabilitas ϵ , maka maks X i adalah indikator kejadian probabilitas n ϵ + O ( n 2 ϵ 2 ) . Memperbaiki n dan membiarkan ϵ cenderung ke nol, kita mendapatkan V a r ( X i ) = ϵ - ϵ 2 dan V a r ( max i X i ) = n ϵ +XiϵmaxXinϵ+O(n2ϵ2)nϵVar(Xi)=ϵϵ2 .Var(maxiXi)=nϵ+O(n2ϵ2)

Yuval Peres
sumber
3

Pertanyaan tentang MathOverflow terkait dengan pertanyaan ini.

Untuk variabel acak IID, tertinggi disebut statistik urutan .k

Bahkan untuk variabel acak IID Bernoulli, varians dari statistik urutan apa pun selain median dapat lebih besar dari varians populasi. Sebagai contoh, jika adalah 1 dengan probabilitas 1 / 10 dan 0 dengan probabilitas 9 / 10 dan M = 10 , maka maksimal adalah 1 dengan probabilitas 1 - 1 / e , sehingga varians dari populasi adalah 0,09 sementara varians dari maksimum adalah sekitar 0,23 .Xi11/1009/10M=10111/e0.090.23

Berikut adalah dua makalah tentang varian statistik pesanan:

Yang, H. (1982) "Pada varian median dan beberapa statistik urutan lainnya." Banteng. Inst. Matematika Acad. Sinica, 10 (2) hal. 197-204

Papadatos, N. (1995) "Varians maksimum dari statistik pesanan." Ann. Inst. Statist. Matematika., 47 (1) hlm. 185-193

Saya percaya batas atas pada varian maksimum dalam makalah kedua adalah . Mereka menunjukkan bahwa kesetaraan tidak dapat terjadi, tetapi nilai yang lebih rendah dapat terjadi untuk variabel acak IID Bernoulli.Mσ2

Douglas Zare
sumber