Apakah distribusi normal bertemu dengan distribusi tertentu jika standar deviasi tumbuh tanpa batas? Tampak bagi saya bahwa pdf mulai tampak seperti distribusi seragam dengan batasan yang diberikan oleh . Apakah ini benar?
normal-distribution
convergence
Ramon Martinez
sumber
sumber
Jawaban:
Jawaban lain sudah ada di sini melakukan pekerjaan yang baik untuk menjelaskan mengapa RV Gaussian tidak bertemu dengan apa pun karena varians meningkat tanpa terikat, tapi saya ingin menunjukkan properti yang tampaknya seragam yang koleksi dari Gaussians seperti itu memuaskan bahwa saya pikir mungkin cukuplah bagi seseorang untuk menebak bahwa mereka menjadi seragam, tetapi itu ternyata tidak cukup kuat untuk menyimpulkan itu.
Pertimbangkan kumpulan variabel acak mana . Misalkan menjadi interval tetap dengan panjang yang terbatas, dan untuk beberapa mendefinisikan , yaitu adalah tetapi hanya digeser oleh . Untuk interval mendefinisikan sebagai panjang , dan perhatikan bahwa .X n ∼ N ( 0 , n 2 ) A = [ a 1 , a 2 ] c ∈ R B = A + c B A c I = [ i 1 , i 2 ] len ( I ) = i 2 - i 1 I len ({X1,X2,…} Xn∼N(0,n2) A=[a1,a2] c∈R B=A+c B A c I=[i1,i2] len(I)=i2−i1 I len(A)=len(B)
Sekarang saya akan membuktikan hasil berikut:
Hasil : sebagai .n → ∞|P(Xn∈A)−P(xn∈B)|→0 n→∞
Saya menyebutnya seperti seragam karena dikatakan bahwa distribusi semakin memiliki dua interval tetap dengan panjang yang sama memiliki probabilitas yang sama, tidak peduli seberapa jauh jaraknya. Itu jelas fitur yang sangat seragam, tetapi seperti yang akan kita lihat ini tidak mengatakan apa-apa tentang distribusi aktual dari menyatu dengan yang seragam.X nXn Xn
Pf: perhatikan bahwa mana jadi Saya dapat menggunakan (sangat kasar) yang mengikat untuk mendapatkan X 1 ∼ N ( 0 , 1 ) P ( X n ∈ A ) = P ( a 1 ≤ n X 1 ≤ a 2 ) = P ( a 1Xn=nX1 X1∼N(0,1) =1
Saya dapat melakukan hal yang sama untuk untuk mendapatkan P ( X n ∈ B ) ≤ len ( B )B
Menyatukan ini saya punya as (Saya menggunakan ketimpangan segitiga di sini).n→∞
Bagaimana ini berbeda dari menyatu pada distribusi yang seragam? Saya baru saja membuktikan bahwa probabilitas yang diberikan pada dua interval tetap dengan panjang terbatas yang sama semakin dekat dan dekat, dan secara intuitif masuk akal bahwa ketika kepadatan "mendatar" dari perspektif dan A BXn A B
Tetapi agar dapat menyatu pada distribusi yang seragam, saya membutuhkan untuk menuju proporsional dengan untuk setiap interval , dan itu adalah hal yang sangat berbeda karena ini perlu diterapkan pada apa pun , tidak hanya satu yang diperbaiki di muka (dan seperti yang disebutkan di tempat lain, ini bahkan tidak mungkin untuk distribusi dengan dukungan tidak terbatas). P ( X n ∈ I ) len ( I ) I IXn P(Xn∈I) len(I) I I
sumber
Kesalahan umum dalam probabilitas adalah berpikir bahwa suatu distribusi seragam karena terlihat secara visual datar ketika semua nilainya mendekati nol. Ini karena kita cenderung melihat bahwa namun , yaitu interval kecil sekitar adalah 1000 kali lebih banyak kemungkinan dari interval kecil di sekitar .f ( x ) / f ( y ) = 0,001 / 0,000001 = 1000 x yf(x)=0.001≈0.000001=f(y) f(x)/f(y)=0.001/0.000001=1000 x y
Ini jelas tidak seragam di seluruh garis nyata di batas, karena tidak ada distribusi seragam di . Ini bahkan tidak kira-kira seragam pada .[ - 2 σ , 2 σ ](−∞,∞) [−2σ,2σ]
Anda dapat melihat yang terakhir dari aturan 68-95-99.7 yang sepertinya Anda kenal. Jika kira-kira seragam pada , maka kemungkinan berada dalam dan harus sama, karena dua interval adalah sama panjangnya. Tapi ini tidak terjadi: , namun .[ 0 , σ ] [ σ , 2 σ ] P ( [ 0 , σ ] ) ≈ 0,68 / 2 = 0,34 P ( [ σ , 2 σ ] ) ≈ ( 0,95 - 0,68 ) / 2 = 0,135[−2σ,2σ] [0,σ] [σ,2σ] P([0,σ])≈0.68/2=0.34 P([σ,2σ])≈(0.95−0.68)/2=0.135
Ketika dilihat melalui seluruh baris nyata, urutan distribusi normal ini tidak menyatu dengan distribusi probabilitas. Ada beberapa cara untuk melihatnya. Sebagai contoh, cdf dari normal dengan standar deviasi adalah , dan untuk semua , yang bukan merupakan cdf dari variabel acak apa pun . Faktanya, ini bukan cdf sama sekali.F σ ( x ) = ( 1 / 2 ) ( 1 + erf ( x / √σ lim σ → ∞ Fσ(x)=1/2xFσ(x)=(1/2)(1+erf(x/2–√σ) limσ→∞Fσ(x)=1/2 x
Alasan non-konvergensi ini bermuara pada "kehilangan massa" adalah batasnya. Fungsi pembatasan dari distribusi normal sebenarnya "hilang" probabilitas (yaitu telah lolos hingga tak terbatas). Ini terkait dengan konsep ketatnya tindakan , yang memberikan kondisi yang diperlukan untuk urutan variabel acak untuk menyatu dengan variabel acak lainnya.
sumber
Pernyataan Anda , pdf mulai terlihat seperti distribusi seragam dengan batasan yang diberikan oleh[−2σ,2σ] σ tidak benar jika Anda menyesuaikan agar sesuai dengan standar deviasi yang lebih luas.σ
Pertimbangkan grafik dua kerapatan normal ini yang berpusat pada nol. Kurva merah sesuai dengan deviasi standar dan kurva biru ke deviasi standar , dan memang demikian halnya bahwa kurva biru hampir rata pada10 [ - 2 , 2 ]1 10 [−2,2]
tetapi untuk kurva biru dengan , kita harus benar-benar melihat bentuknya pada . Menyalin ulang -aksi dan -aksi dengan faktor memberikan plot berikut ini, dan Anda mendapatkan bentuk yang sama persis untuk densitas biru di plot selanjutnya dengan densitas merah di plot sebelumnya [ - 20 , 20 ] x y 10σ=10 [−20,20] x y 10
sumber
Pertanyaan Anda secara mendasar cacat. The distribusi normal standar adalah skala sehingga . Jadi untuk beberapa distribusi Gaussian lainnya ( ) maka kurva antar batas memiliki bentuk yang sama dengan distribusi normal standar. Satu-satunya perbedaan adalah faktor penskalaan. Jadi, jika Anda mengubah skala Gaussian dengan membaginya dengan , maka Anda berakhir dengan distribusi normal standar.σ=1 μ=0,σ=σ∗ ∗, 2 σ∗] σ∗
Sekarang jika Anda memiliki distribusi Gaussian ( ) maka ya sebagai , wilayah antara menjadi semakin datar.μ = 0 , σ= σ∗ σ∗→∞ [−2,2]
sumber