Berapa varians dari maksimum sampel?

$B$

Var (max_{i} X_{i}) \leq B,

$\mbox{Var}(\max_i X_i) \leq B \enspace,$

X = {X_{1}, \dots, X_{M}}

$X = \{ X_1, \ldots, X_M \}$

M

$M$

μ_{1}, \dots, μ_{M}

$\mu_1, \ldots, \mu_M$

σ_{1}^{2}, \dots, σ_{M}^{2}

$\sigma_1^2, \ldots, \sigma_M^2$

Saya dapat menyimpulkan bahwa tetapi batasan ini tampaknya sangat longgar. Tes numerik tampaknya menunjukkan bahwa mungkin merupakan suatu kemungkinan, tetapi saya belum dapat membuktikannya. Bantuan apa pun dihargai.

Var (max_{i} X_{i}) \leq \sum_{i} σ_{i}^{2},

$\mbox{Var}(\max_i X_i) \leq \sum_i \sigma_i^2 \enspace,$

B = max_{i} σ_{i}^{2}

$B = \max_i \sigma_i^2$

variance bounds maximum Peter
sumber

(Apakah Anda ingin menganggap independen?) Dugaan ini masuk akal tetapi tampaknya salah. Misalnya, lakukan beberapa percobaan di mana iid dengan CDF , , . Varians maksimum mereka, relatif terhadap varian umum mereka, meningkat tanpa terikat ketika tumbuh.

X_{i}

$X_i$

X_{i}

$X_i$

1 - x^{1 - s}

$1-x^{1-s}$

1 \leq x \leq \infty

$1\le x\le \infty$

s > 3

$s\gt 3$

M

$M$

Whuber

@whuber Terima kasih, itu menjelaskan mengapa saya tidak dapat membuktikan dugaan itu :) Saya memang tertarik pada kasus di mana

X_{i}

$X_i$ independen. Hanya untuk memperjelas, saya lebih tertarik pada batasan umum yang hanya menggunakan dua momen pertama. Saya tidak yakin apakah batas umum yang lebih tajam bahkan ada daripada varian umum.

Peter

Saya harus menunjukkan bahwa jumlah Anda terikat (dengan asumsi itu benar - akan menyenangkan untuk melihat sketsa buktinya) ketat. Sebagai contoh, misalkan

X_{2}, \dots, X_{M}

$X_2,\ldots,X_M$ didukung pada interval

[- \infty, a]

$[-\infty, a]$ dengan varian tidak melebihi

ε^{2}

$\varepsilon^2$ dan biarkan

X_{1}

$X_1$ didukung pada

[a, \infty]

$[a,\infty]$ . Kemudian

max_{i} X_{i} = X_{1}

$\max_i{X_i}=X_1$ as, dengan varian

σ_{1}^{2} \leq σ_{1}^{2} + (M - 1) ε^{2}

$\sigma_1^2\le\sigma_1^2+(M-1)\varepsilon^2$ , tetapi ketidaksetaraan dapat diperketat sebanyak yang Anda suka dengan menyusut

ε^{2}

$\varepsilon^2$ .

whuber

Untuk data awal, teori nilai ekstrem menyediakan kelas-kelas distribusi tempat sampel maksimum bertemu, dengan kondisi tertentu pada ekor distribusi asli yang memberikan kelas-kelas berbeda dari distribusi asimptotik. Jadi saya ragu bahwa Anda akan dapat memperoleh ikatan yang baik hanya berdasarkan pada dua momen saja, meskipun saya hanya akrab dengan teori.

Tugas

Jawaban:

Untuk setiap variabel acak , yang terbaik umum terikat adalah sebagaimana tercantum dalam pertanyaan awal. Berikut ini adalah sketsa bukti: Jika X, Y adalah IID, maka . Diberikan vektor variabel yang mungkin tergantung $n$ $X_i$ $\newcommand{\Var}{\mathrm{Var}}\Var(\max X_i) \le \sum_i \Var(X_i)$ $E[(X-Y)^2] =2\Var(X)$ , misalkan menjadi vektor independen dengan distribusi gabungan yang sama. Untuk setiap , kita memiliki ikatan dengan serikat bahwa $(X_1,\ldots ,X_n)$ $(Y_1,\ldots ,Y_n)$ $r>0$ $P[ |\max_i X_i-\max_i Y_i|^2 >r] \le \sum_i P[ | X_i-Y_i|^2 >r]$ , Dan mengintegrasikan ini dari ke hasil ketidaksetaraan diklaim. $dr$ $0$ $\infty$

Jika adalah indikator IID dari peristiwa probabilitas , maka adalah indikator kejadian probabilitas . Memperbaiki dan membiarkan cenderung ke nol, kita mendapatkan dan $X_i$ $\epsilon$ $\max X_i$ $n\epsilon+O(n^2 \epsilon^2)$ $n$ $\epsilon$ $\Var(X_i)=\epsilon-\epsilon^2$ . $\Var(\max_i X_i)= n\epsilon +O(n^2\epsilon^2)$

Yuval Peres
sumber

Pertanyaan tentang MathOverflow terkait dengan pertanyaan ini.

Untuk variabel acak IID, tertinggi disebut statistik urutan . $k$

Bahkan untuk variabel acak IID Bernoulli, varians dari statistik urutan apa pun selain median dapat lebih besar dari varians populasi. Sebagai contoh, jika adalah dengan probabilitas dan dengan probabilitas dan , maka maksimal adalah dengan probabilitas , sehingga varians dari populasi adalah sementara varians dari maksimum adalah sekitar . $X_i$ $1$ $1/10$ $0$ $9/10$ $M=10$ $1$ $\approx 1- 1/e$ $0.09$ $0.23$

Berikut adalah dua makalah tentang varian statistik pesanan:

Yang, H. (1982) "Pada varian median dan beberapa statistik urutan lainnya." Banteng. Inst. Matematika Acad. Sinica, 10 (2) hal. 197-204

Papadatos, N. (1995) "Varians maksimum dari statistik pesanan." Ann. Inst. Statist. Matematika., 47 (1) hlm. 185-193

Saya percaya batas atas pada varian maksimum dalam makalah kedua adalah . Mereka menunjukkan bahwa kesetaraan tidak dapat terjadi, tetapi nilai yang lebih rendah dapat terjadi untuk variabel acak IID Bernoulli. $M\sigma^2$

Douglas Zare
sumber