Apakah distribusi normal bertemu menjadi distribusi yang seragam ketika deviasi standar tumbuh hingga tak terbatas?

18

Apakah distribusi normal bertemu dengan distribusi tertentu jika standar deviasi tumbuh tanpa batas? Tampak bagi saya bahwa pdf mulai tampak seperti distribusi seragam dengan batasan yang diberikan oleh . Apakah ini benar?[2σ,2σ]

Ramon Martinez
sumber
2
Tidak, tetapi untuk menjawab pertanyaan Anda dengan benar, kami perlu tahu apa definisi konvergensi Anda. Ingatlah bahwa diskusi formal hanya mungkin dilakukan ketika sisi kanan tidak berubah. Jadi, Anda tidak dapat menetapkan konvergensi ke Unifrom [ ] karena berubah. Lihat formulasi CLT untuk melihat apa yang saya maksudσ,σσ
Aksakal
hanya jika Anda membungkus atau memotongnya menjadi sesuatu . o(σ)
enthdegree

Jawaban:

4

Jawaban lain sudah ada di sini melakukan pekerjaan yang baik untuk menjelaskan mengapa RV Gaussian tidak bertemu dengan apa pun karena varians meningkat tanpa terikat, tapi saya ingin menunjukkan properti yang tampaknya seragam yang koleksi dari Gaussians seperti itu memuaskan bahwa saya pikir mungkin cukuplah bagi seseorang untuk menebak bahwa mereka menjadi seragam, tetapi itu ternyata tidak cukup kuat untuk menyimpulkan itu.

Pertimbangkan kumpulan variabel acak mana . Misalkan menjadi interval tetap dengan panjang yang terbatas, dan untuk beberapa mendefinisikan , yaitu adalah tetapi hanya digeser oleh . Untuk interval mendefinisikan sebagai panjang , dan perhatikan bahwa .X nN ( 0 , n 2 ) A = [ a 1 , a 2 ] c R B = A + c B A c I = [ i 1 , i 2 ] len ( I ) = i 2 - i 1 I len ({X1,X2,}XnN(0,n2)A=[a1,a2]cRB=A+cBAcI=[i1,i2]len(I)=i2i1Ilen(A)=len(B)

Sekarang saya akan membuktikan hasil berikut:

Hasil : sebagai .n |P(XnA)P(xnB)|0n

Saya menyebutnya seperti seragam karena dikatakan bahwa distribusi semakin memiliki dua interval tetap dengan panjang yang sama memiliki probabilitas yang sama, tidak peduli seberapa jauh jaraknya. Itu jelas fitur yang sangat seragam, tetapi seperti yang akan kita lihat ini tidak mengatakan apa-apa tentang distribusi aktual dari menyatu dengan yang seragam.X nXnXn

Pf: perhatikan bahwa mana jadi Saya dapat menggunakan (sangat kasar) yang mengikat untuk mendapatkan X 1N ( 0 , 1 ) P ( X nA ) = P ( a 1n X 1a 2 ) = P ( a 1Xn=nX1X1N(0,1)=1

P(XnA)=P(a1nX1a2)=P(a1nX1a2n)
e - x 2 / 21 1
=12πa1/na2/nex2/2dx.
ex2/21= len ( A )
12πa1/na2/nex2/2dx12πa1/na2/n1dx
=len(A)n2π.

Saya dapat melakukan hal yang sama untuk untuk mendapatkan P ( X nB ) len ( B )B

P(XnB)len(B)n2π.

Menyatukan ini saya punya as (Saya menggunakan ketimpangan segitiga di sini).n

|P(XnA)P(XnB)|2len(A)nπ0
n

Bagaimana ini berbeda dari menyatu pada distribusi yang seragam? Saya baru saja membuktikan bahwa probabilitas yang diberikan pada dua interval tetap dengan panjang terbatas yang sama semakin dekat dan dekat, dan secara intuitif masuk akal bahwa ketika kepadatan "mendatar" dari perspektif dan A BXnAB

Tetapi agar dapat menyatu pada distribusi yang seragam, saya membutuhkan untuk menuju proporsional dengan untuk setiap interval , dan itu adalah hal yang sangat berbeda karena ini perlu diterapkan pada apa pun , tidak hanya satu yang diperbaiki di muka (dan seperti yang disebutkan di tempat lain, ini bahkan tidak mungkin untuk distribusi dengan dukungan tidak terbatas). P ( X nI ) len ( I ) I IXnP(XnI)len(I)II

jld
sumber
Benar, Anda hampir bisa mengatakan mereka berkumpul dalam distribusi, kecuali bahwa batas dari apa yang mereka konvergensi adalah distribusi yang tidak tepat. Salah satu jenis konvergensi yang akan didefinisikan dengan baik adalah saya kira Anda dapat menunjukkan bahwa metrik Wasserstein akan mendekati nol sebagai ? σ
Cliff AB
36

Kesalahan umum dalam probabilitas adalah berpikir bahwa suatu distribusi seragam karena terlihat secara visual datar ketika semua nilainya mendekati nol. Ini karena kita cenderung melihat bahwa namun , yaitu interval kecil sekitar adalah 1000 kali lebih banyak kemungkinan dari interval kecil di sekitar .f ( x ) / f ( y ) = 0,001 / 0,000001 = 1000 x yf(x)=0.0010.000001=f(y)f(x)/f(y)=0.001/0.000001=1000xy

Ini jelas tidak seragam di seluruh garis nyata di batas, karena tidak ada distribusi seragam di . Ini bahkan tidak kira-kira seragam pada .[ - 2 σ , 2 σ ](,)[2σ,2σ]

Anda dapat melihat yang terakhir dari aturan 68-95-99.7 yang sepertinya Anda kenal. Jika kira-kira seragam pada , maka kemungkinan berada dalam dan harus sama, karena dua interval adalah sama panjangnya. Tapi ini tidak terjadi: , namun .[ 0 , σ ] [ σ , 2 σ ] P ( [ 0 , σ ] ) 0,68 / 2 = 0,34 P ( [ σ , 2 σ ] ) ( 0,95 - 0,68 ) / 2 = 0,135[2σ,2σ][0,σ][σ,2σ]P([0,σ])0.68/2=0.34P([σ,2σ])(0.950.68)/2=0.135

Ketika dilihat melalui seluruh baris nyata, urutan distribusi normal ini tidak menyatu dengan distribusi probabilitas. Ada beberapa cara untuk melihatnya. Sebagai contoh, cdf dari normal dengan standar deviasi adalah , dan untuk semua , yang bukan merupakan cdf dari variabel acak apa pun . Faktanya, ini bukan cdf sama sekali.F σ ( x ) = ( 1 / 2 ) ( 1 + erf ( x / σlim σ Fσ(x)=1/2xFσ(x)=(1/2)(1+erf(x/2σ)limσFσ(x)=1/2x

Alasan non-konvergensi ini bermuara pada "kehilangan massa" adalah batasnya. Fungsi pembatasan dari distribusi normal sebenarnya "hilang" probabilitas (yaitu telah lolos hingga tak terbatas). Ini terkait dengan konsep ketatnya tindakan , yang memberikan kondisi yang diperlukan untuk urutan variabel acak untuk menyatu dengan variabel acak lainnya.

Alex R.
sumber
1
Yang salah "itu" adalah "semua nilainya hampir nol". "Ini" dalam "Ini kesalahan umum" benar.
Akumulasi
15

Pernyataan Anda , pdf mulai terlihat seperti distribusi seragam dengan batasan yang diberikan oleh[2σ,2σ] σ tidak benar jika Anda menyesuaikan agar sesuai dengan standar deviasi yang lebih luas.σ

Pertimbangkan grafik dua kerapatan normal ini yang berpusat pada nol. Kurva merah sesuai dengan deviasi standar dan kurva biru ke deviasi standar , dan memang demikian halnya bahwa kurva biru hampir rata pada10 [ - 2 , 2 ]110[2,2]

masukkan deskripsi gambar di sini

tetapi untuk kurva biru dengan , kita harus benar-benar melihat bentuknya pada . Menyalin ulang -aksi dan -aksi dengan faktor memberikan plot berikut ini, dan Anda mendapatkan bentuk yang sama persis untuk densitas biru di plot selanjutnya dengan densitas merah di plot sebelumnya [ - 20 , 20 ] x y 10σ=10[20,20]xy10

masukkan deskripsi gambar di sini

Henry
sumber
2

Pertanyaan Anda secara mendasar cacat. The distribusi normal standar adalah skala sehingga . Jadi untuk beberapa distribusi Gaussian lainnya ( ) maka kurva antar batas memiliki bentuk yang sama dengan distribusi normal standar. Satu-satunya perbedaan adalah faktor penskalaan. Jadi, jika Anda mengubah skala Gaussian dengan membaginya dengan , maka Anda berakhir dengan distribusi normal standar.σ=1μ=0,σ=σ[-2σ,2σ]σ

Sekarang jika Anda memiliki distribusi Gaussian ( ) maka ya sebagai , wilayah antara menjadi semakin datar.μ=0,σ=σσ[2,2]

MaxW
sumber