Teori Nilai Ekstrim - Perlihatkan: Normal ke Gumbel

21

Maksimum iid Standardnormals konvergen ke Distribusi Gumbel Standar sesuai dengan Teori Nilai Ekstrim .X1,,Xn.

Bagaimana kita bisa menunjukkan itu?

Kita punya

P(maxXix)=P(X1x,,Xnx)=P(X1x)P(Xnx)=F(x)n

Kita perlu menemukan / memilih an>0,bnR urutan konstanta sedemikian rupa sehingga:

F(anx+bn)nnG(x)=eexp(x)

Bisakah Anda menyelesaikannya atau menemukannya dalam literatur?

Ada beberapa contoh hal.6 / 71 , tetapi tidak untuk kasus Normal:

Φ(anx+bn)n=(12πanx+bney22dy)neexp(x)
emcor
sumber

Jawaban:

23

Cara tidak langsung, adalah sebagai berikut:
Untuk distribusi yang benar-benar berkelanjutan, Richard von Mises (dalam makalah 1936 "La distribution de la plus grande de n valeurs" , yang tampaknya telah direproduksi -dalam bahasa Inggris? - dalam edisi 1964 dengan pilihan kertas miliknya), telah memberikan kondisi yang cukup berikut untuk maksimum sampel untuk menyatu dengan standar Gumbel, :G(x)

Misalkan menjadi fungsi distribusi umum dari variabel acak, dan kerapatan bersama. Lalu jikan f ( x )F(x)nf(x)

limxF1(1)(ddx(1F(x))f(x))=0X(n)dG(x)

Menggunakan notasi biasa untuk standar normal dan menghitung derivatif, kami miliki

ddx(1Φ(x))ϕ(x)=ϕ(x)2ϕ(x)(1Φ(x))ϕ(x)2=ϕ(x)ϕ(x)(1Φ(x))ϕ(x)1

Perhatikan bahwa . Juga, untuk distribusi normal, . Jadi kita harus mengevaluasi batasannyaF-1(1)=ϕ(x)ϕ(x)=xF1(1)=

limx(x(1Φ(x))ϕ(x)1)

Tetapi adalah rasio Mill, dan kita tahu bahwa rasio Mill untuk standar normal cenderung ketika tumbuh. Begitu 1/xx(1Φ(x))ϕ(x)1/xx

limx(x(1Φ(x))ϕ(x)1)=x1x1=0

dan kondisi yang cukup terpenuhi.

Seri terkait diberikan sebagai

an=1nϕ(bn),bn=Φ1(11/n)

TAMBAHAN

Ini dari ch. 10,5 dari buku HA David & HN Nagaraja (2003), "Order Statistics" (edisi 3d) .

f ( t )ξa=F1(a) . Juga, referensi ke de Haan adalah "Haan, LD (1976). Contoh ekstrem: pengantar dasar. Statistica Neerlandica, 30 (4), 161-172. " Tetapi waspadalah karena beberapa notasi memiliki konten yang berbeda di de Haan - misalnya dalam buku adalah fungsi kerapatan probabilitas, sedangkan dalam de Haan berarti fungsi buku (yaitu rasio Mill). Juga, de Haan memeriksa kondisi yang cukup sudah dibedakan.f(t) w ( t )f(t)w(t)

masukkan deskripsi gambar di sini

Alecos Papadopoulos
sumber
Saya tidak yakin saya mengerti solusi Anda. Jadi Anda menganggap sebagai CDF normal standar. Saya menindaklanjuti dan setuju bahwa kondisi yang cukup puas. Tapi bagaimana seri terkait dan tiba-tiba diberikan oleh mereka? a n b nFanbn
renrenthehamster
@renrenthehamster Saya pikir kedua bagian ini dinyatakan secara independen (tidak ada koneksi langsung).
emcor
Jadi bagaimana mungkin seri terkait diperoleh? Lagi pula, saya membuka pertanyaan tentang masalah ini (dan lebih umum lagi, untuk distribusi lain di luar standar normal)
renrenthehamster
@renrenthehamster Saya telah menambahkan materi yang relevan. Saya tidak percaya ada resep standar untuk semua kasus, untuk menemukan seri ini.
Alecos Papadopoulos
14

Pertanyaannya menanyakan dua hal: (1) bagaimana menunjukkan bahwa maksimum menyatu, dalam arti bahwa menyatu (dalam distribusi) untuk urutan yang dipilih secara tepat dan , ke distribusi Standard Gumbel dan (2) bagaimana menemukan urutan tersebut. ( X ( n ) - b n ) / a n ( a n ) ( b n )X(n)(X(n)bn)/an(an)(bn)

Yang pertama terkenal dan didokumentasikan dalam makalah asli pada teorema Fisher-Tippett-Gnedenko (FTG). Yang kedua tampaknya lebih sulit; itulah masalah yang dibahas di sini.

Harap dicatat, untuk mengklarifikasi beberapa pernyataan yang muncul di tempat lain di utas ini, itu

  1. Maksimum tidak menyatu dengan apa pun: ia menyimpang (meskipun sangat lambat).

  2. Tampaknya ada konvensi yang berbeda mengenai distribusi Gumbel. Saya akan mengadopsi konvensi bahwa CDF dari distribusi Gumbel terbalik , hingga skala dan lokasi, diberikan oleh . Maksimum yang sesuai dengan standar dari variasi Normal normal bertemu dengan distribusi Gumbel terbalik.1exp(exp(x))


Intuisi

Ketika iid dengan fungsi distribusi umum , distribusi maksimum adalah F X ( n )XiFX(n)

Fn(x)=Pr(X(n)x)=Pr(X1x)Pr(X2x)Pr(Xnx)=Fn(x).

Ketika dukungan tidak memiliki batas atas, seperti dengan distribusi Normal, urutan fungsi berbaris selamanya ke kanan tanpa batas:F nFFn

Gambar 1

Grafik parsial untuk ditampilkan. n = 1 , 2 , 2 2 , 2 4 , 2 8 , 2 16Fnn=1,2,22,24,28,216

Untuk mempelajari bentuk distribusi ini, kita dapat menggeser masing-masing kembali ke kiri dengan sejumlah dan ulang dengan untuk membuatnya sebanding.a nbnan

Gambar 2

Masing-masing grafik sebelumnya telah digeser untuk menempatkan mediannya pada dan untuk membuat kisaran interkuartil dari satuan panjangnya.0

FTG menegaskan bahwa sekuens dan dapat dipilih sehingga fungsi distribusi ini konvergen pada setiap ke beberapa distribusi nilai ekstrim , hingga skala dan lokasi. Ketika adalah distribusi normal, distribusi nilai ekstrem yang membatasi tertentu adalah Gumbel terbalik, hingga lokasi dan skala.( b n ) x F(an)(bn)xF


Larutan

Sangat menggoda untuk mengemulasi Teorema Limit Pusat dengan menstandarisasi untuk memiliki satuan mean dan varian unit. Ini tidak tepat, sebagian, karena FTG berlaku bahkan untuk distribusi (berkelanjutan) yang tidak memiliki momen pertama atau kedua. Sebaliknya, gunakan persentil (seperti median) untuk menentukan lokasi dan perbedaan persentil (seperti IQR) untuk menentukan penyebaran. (Pendekatan umum ini harus berhasil menemukan dan untuk setiap distribusi berkelanjutan.)a n b nFnanbn

Untuk distribusi Normal standar, ini ternyata mudah! Biarkan . dari bersesuaian dengan adalah setiap nilai yang . Mengingat definisi , solusinya adalahF n q x q F n ( x q ) = q F n ( x ) = F n ( x )0<q<1FnqxqFn(xq)=qFn(x)=Fn(x)

xq;n=F1(q1/n).

Karena itu kita dapat mengatur

bn=x1/2;n, an=x3/4;nx1/4;n; Gn(x)=Fn(anx+bn).

Karena, dengan konstruksi, median adalah dan IQR-nya adalah , median nilai pembatas (yang merupakan beberapa versi Gumbel terbalik) harus dan IQR-nya harus . Biarkan parameter skala menjadi dan parameter lokasi menjadi . Karena median adalah dan IQR mudah ditemukan , parameter harusGn01Gn01βαα+βloglog(2)β(loglog(4)loglog(4/3))

α=loglog2loglog(4/3)loglog(4); β=1loglog(4)loglog(4/3).

Tidak perlu bagi dan untuk secara tepat nilai-nilai ini: mereka hanya perlu memperkirakannya, asalkan batas masih distribusi Gumbel terbalik ini. Analisis langsung (tetapi membosankan) untuk normal standar menunjukkan bahwa perkiraananbnGnF

an=log((4log2(2))/(log2(43)))22log(n), bn=2log(n)log(log(n))+log(4πlog2(2))22log(n)

akan bekerja dengan baik (dan sesederhana mungkin).

Gambar 3

Kurva biru muda adalah grafik parsial untuk menggunakan urutan perkiraan dan . Garis merah gelap menggambarkan distribusi Gumbel terbalik dengan parameter dan . Konvergensi jelas (walaupun laju konvergensi untuk negatif terasa lebih lambat). n = 2 , 2 6 , 2 11 , 2 16 a n b n α β xGnn=2,26,211,216anbnαβx


Referensi

BV Gnedenko, Tentang Pembatasan Distribusi Istilah Maksimal dalam Seri Acak . Dalam Kotz dan Johnson, Terobosan dalam Statistik Volume I: Yayasan dan Teori Dasar, Springer, 1992. Diterjemahkan oleh Norman Johnson.

whuber
sumber
@Vossler Rumus dalam posting untuk konvergen ke sebagai . Berperilaku seperti untuk besar . 0 n ( 2 log ( n ) - log ( 2 π ) ) - 1 / 2 nan0n(2log(n)log(2π))1/2n
Whuber
Ya, itu benar, saya menyadari hal ini segera setelah saya memposting komentar saya jadi saya segera menghapusnya. Terima kasih!
Vossler
@Jess, saya berharap jawaban ini dipahami sebagai menunjukkan, antara lain, bahwa tidak ada yang namanya rumus "the": ada banyak sekali rumus yang benar untuk danb n .anbn.
whuber
@Jess Itu lebih baik, karena menunjukkan pendekatan alternatif adalah motivasi untuk menulis jawaban ini. Saya tidak mengerti sindiran Anda yang saya anggap "tidak berguna untuk menuliskan jawaban," karena itulah yang secara eksplisit saya lakukan di sini.
Whuber
@Jess Saya tidak dapat melanjutkan percakapan ini karena sepenuhnya sepihak: Saya belum mengenali apa pun yang saya tulis dalam salah satu penokohan Anda. Saya berhenti sementara saya di belakang.
whuber