Cara tidak langsung, adalah sebagai berikut:
Untuk distribusi yang benar-benar berkelanjutan, Richard von Mises (dalam makalah 1936 "La distribution de la plus grande de n valeurs" , yang tampaknya telah direproduksi -dalam bahasa Inggris? - dalam edisi 1964 dengan pilihan kertas miliknya), telah memberikan kondisi yang cukup berikut untuk maksimum sampel untuk menyatu dengan standar Gumbel, :G ( x )
Misalkan menjadi fungsi distribusi umum dari variabel acak, dan kerapatan bersama. Lalu jikan f ( x )F( x )nf( x )
limx → F- 1( 1 )( ddx( 1 - F( x ) )f( x )) =0⇒ X( n )→dG ( x )
Menggunakan notasi biasa untuk standar normal dan menghitung derivatif, kami miliki
ddx( 1 - Φ ( x ) )ϕ ( x )= - ϕ ( x )2- ϕ′(x)(1−Φ(x))ϕ(x)2=−ϕ′(x)ϕ(x)(1−Φ(x))ϕ(x)−1
Perhatikan bahwa . Juga, untuk distribusi normal, . Jadi kita harus mengevaluasi batasannyaF-1(1)=∞−ϕ′(x)ϕ(x)=xF−1(1)=∞
limx→∞(x(1−Φ(x))ϕ(x)−1)
Tetapi adalah rasio Mill, dan kita tahu bahwa rasio Mill untuk standar normal cenderung ketika tumbuh. Begitu 1/xx(1−Φ(x))ϕ(x)1/xx
limx→∞(x(1−Φ(x))ϕ(x)−1)=x1x−1=0
dan kondisi yang cukup terpenuhi.
Seri terkait diberikan sebagai
an=1nϕ(bn),bn=Φ−1(1−1/n)
TAMBAHAN
Ini dari ch. 10,5 dari buku HA David & HN Nagaraja (2003), "Order Statistics" (edisi 3d) .
f ( t )ξa=F−1(a) . Juga, referensi ke de Haan adalah "Haan, LD (1976). Contoh ekstrem: pengantar dasar. Statistica Neerlandica, 30 (4), 161-172. " Tetapi waspadalah karena beberapa notasi memiliki konten yang berbeda di de Haan - misalnya dalam buku adalah fungsi kerapatan probabilitas, sedangkan dalam de Haan berarti fungsi buku (yaitu rasio Mill). Juga, de Haan memeriksa kondisi yang cukup sudah dibedakan.f(t) w ( t )f(t)w ( t )
Pertanyaannya menanyakan dua hal: (1) bagaimana menunjukkan bahwa maksimum menyatu, dalam arti bahwa menyatu (dalam distribusi) untuk urutan yang dipilih secara tepat dan , ke distribusi Standard Gumbel dan (2) bagaimana menemukan urutan tersebut. ( X ( n ) - b n ) / a n ( a n ) ( b n )X(n) (X(n)−bn)/an (an) (bn)
Yang pertama terkenal dan didokumentasikan dalam makalah asli pada teorema Fisher-Tippett-Gnedenko (FTG). Yang kedua tampaknya lebih sulit; itulah masalah yang dibahas di sini.
Harap dicatat, untuk mengklarifikasi beberapa pernyataan yang muncul di tempat lain di utas ini, itu
Maksimum tidak menyatu dengan apa pun: ia menyimpang (meskipun sangat lambat).
Tampaknya ada konvensi yang berbeda mengenai distribusi Gumbel. Saya akan mengadopsi konvensi bahwa CDF dari distribusi Gumbel terbalik , hingga skala dan lokasi, diberikan oleh . Maksimum yang sesuai dengan standar dari variasi Normal normal bertemu dengan distribusi Gumbel terbalik.1−exp(−exp( x ) )
Intuisi
Ketika iid dengan fungsi distribusi umum , distribusi maksimum adalah F X ( n )Xsaya F X( n )
Ketika dukungan tidak memiliki batas atas, seperti dengan distribusi Normal, urutan fungsi berbaris selamanya ke kanan tanpa batas:F nF Fn
Grafik parsial untuk ditampilkan. n = 1 , 2 , 2 2 , 2 4 , 2 8 , 2 16Fn n = 1 , 2 , 22, 24, 28, 216
Untuk mempelajari bentuk distribusi ini, kita dapat menggeser masing-masing kembali ke kiri dengan sejumlah dan ulang dengan untuk membuatnya sebanding.a nbn Sebuahn
Masing-masing grafik sebelumnya telah digeser untuk menempatkan mediannya pada dan untuk membuat kisaran interkuartil dari satuan panjangnya.0
FTG menegaskan bahwa sekuens dan dapat dipilih sehingga fungsi distribusi ini konvergen pada setiap ke beberapa distribusi nilai ekstrim , hingga skala dan lokasi. Ketika adalah distribusi normal, distribusi nilai ekstrem yang membatasi tertentu adalah Gumbel terbalik, hingga lokasi dan skala.( b n ) x F( an) ( bn) x F
Larutan
Sangat menggoda untuk mengemulasi Teorema Limit Pusat dengan menstandarisasi untuk memiliki satuan mean dan varian unit. Ini tidak tepat, sebagian, karena FTG berlaku bahkan untuk distribusi (berkelanjutan) yang tidak memiliki momen pertama atau kedua. Sebaliknya, gunakan persentil (seperti median) untuk menentukan lokasi dan perbedaan persentil (seperti IQR) untuk menentukan penyebaran. (Pendekatan umum ini harus berhasil menemukan dan untuk setiap distribusi berkelanjutan.)a n b nFn Sebuahn bn
Untuk distribusi Normal standar, ini ternyata mudah! Biarkan . dari bersesuaian dengan adalah setiap nilai yang . Mengingat definisi , solusinya adalahF n q x q F n ( x q ) = q F n ( x ) = F n ( x )0 < q< 1 Fn q xq Fn( xq) = q Fn( x ) = Fn( x )
Karena itu kita dapat mengatur
Karena, dengan konstruksi, median adalah dan IQR-nya adalah , median nilai pembatas (yang merupakan beberapa versi Gumbel terbalik) harus dan IQR-nya harus . Biarkan parameter skala menjadi dan parameter lokasi menjadi . Karena median adalah dan IQR mudah ditemukan , parameter harusGn 0 1 Gn 0 1 β α α+βloglog(2) β(loglog(4)−loglog(4/3))
Tidak perlu bagi dan untuk secara tepat nilai-nilai ini: mereka hanya perlu memperkirakannya, asalkan batas masih distribusi Gumbel terbalik ini. Analisis langsung (tetapi membosankan) untuk normal standar menunjukkan bahwa perkiraanan bn Gn F
akan bekerja dengan baik (dan sesederhana mungkin).
Kurva biru muda adalah grafik parsial untuk menggunakan urutan perkiraan dan . Garis merah gelap menggambarkan distribusi Gumbel terbalik dengan parameter dan . Konvergensi jelas (walaupun laju konvergensi untuk negatif terasa lebih lambat). n = 2 , 2 6 , 2 11 , 2 16 a ′ n b ′ n α β xGn n=2,26,211,216 a′n b′n α β x
Referensi
BV Gnedenko, Tentang Pembatasan Distribusi Istilah Maksimal dalam Seri Acak . Dalam Kotz dan Johnson, Terobosan dalam Statistik Volume I: Yayasan dan Teori Dasar, Springer, 1992. Diterjemahkan oleh Norman Johnson.
sumber