Apa karakterisasi paling mengejutkan dari distribusi Gaussian (normal)?

52

Distribusi Gaussian terstandardisasi pada dapat didefinisikan dengan memberikan kepadatannya secara eksplisit: 1R

12πex2/2

atau fungsi karakteristiknya.

Sebagai kenang dalam ini pertanyaan itu juga satu-satunya distribusi yang mean sampel dan varians independen.

Apa karakterisasi alternatif mengejutkan lain dari tindakan Gaussian yang Anda tahu? Saya akan menerima jawaban yang paling mengejutkan

robin girard
sumber

Jawaban:

39

Pribadi saya yang paling mengejutkan adalah tentang rata-rata sampel dan varians, tetapi di sini ada satu lagi (mungkin) karakterisasi mengejutkan: jika dan adalah IID dengan varian terbatas dengan dan independen, maka dan adalah normal.Y X + Y X - Y X YXYX+YXYXY

Secara intuitif, kita biasanya dapat mengidentifikasi ketika variabel tidak independen dengan sebaran. Jadi bayangkan sebuah scatterplot pasangan yang terlihat independen. Sekarang putar dengan 45 derajat dan lihat lagi: jika masih terlihat independen, maka koordinat dan individual harus normal (ini semua berbicara secara longgar, tentu saja).X Y(X,Y)XY

Untuk melihat mengapa bit intuitif berfungsi, lihat

[cos45sin45sin45cos45][xy]=12[xyx+y]
pengguna1108
sumber
3
Jay - ini pada dasarnya merupakan pernyataan ulang dari mean dan varians yang independen. adalah skala rata-rata dan adalah standar deviasi yang dihitung ulang. X - YX+YXY
probabilityislogic
5
@probabilityislogic - Saya suka intuisi dari apa yang Anda katakan, tapi saya tidak berpikir itu adalah penyajian ulang karena sebenarnya bukan pengubahan ukuran SD: SD lupa tandanya. Jadi independensi mean dan SD mengikuti dari independensi , (ketika ), tetapi tidak sebaliknya. Itu mungkin yang Anda maksud dengan "pada dasarnya". Bagaimanapun, ini hal yang baik. X + Y X - Y n = 2XYX+YXYn=2
4
Di mana kami dapat menemukan bukti untuk properti ini?
Royi
1
@Royi lihat 16. di sini . Untuk (a), perhatikan bahwa . Untuk (b) perhatikan bahwa yang merindukan substitusi dari mana Anda mendapatkan . Jika , maka , maka untuk semua , dan ada urutan sedemikian rupa sehingga dan untuk semua , yang bertentangan dengan kontinuitas padaφ ( 2 t ) φ ( - 2 t ) = ( φ ( t ) φ ( - t ) ) 4 ψ ( t ) = φ ( t ) φ ( - t ) ψ ( t ) = ψ 2 2 n2X=(X+Y)+(XY)φ(2t)φ(2t)=(φ(t)φ(t))4ψ(t)=φ(t)φ(t)φ(t0)=0ψ(t0)=0nψ(t0ψ(t)=ψ22n(t2n)φ(t0)=0ψ(t0)=0ntntn0φ(tn)=0nφ0ψ(t02n)=0tntn0φ(tn)=0nφ0. (c) lurus ke depan [lanjutan]
Gabriel Romon
1
Untuk (d), . Perhatikan bahwa , maka . Masukkan ini dalam persamaan sebelumnya dan buktikan bahwa untuk tetap , yang menyiratkan untuk semua . Ini berarti adalah nyata, dan persamaan dalam (a) berubah menjadi apa yang diminta. Sekali lagi, buktikan bahwa dan gunakan untuk mendapatkan . Karenanya danφ(t)=1-t2γ(t)=γ2n(t2n)φ(t)=1t22+o(t2)γ(t)=1+o(t2)tγ(t)=1tφφ(t)=φ22n(tlimnγ2n(t2n)=1γ(t)=1tφφ(t)=1-t2φ(t)=φ22n(t2n)limnφ2 2 n (tφ(t)=1t22+o(t2)φ(t)=e-t2/2Xlimnφ22n(t2n)=et2/2φ(t)=et2/2X normal.
Gabriel Romon
27

Distribusi kontinu dengan varian tetap yang memaksimalkan entropi diferensial adalah distribusi Gaussian.

shabbychef
sumber
22

Ada seluruh buku yang ditulis tentang ini: "Karakterisasi hukum probabilitas normal", AM Mathai & G. Perderzoli. Ulasan singkat di JASA (Desember 1978) menyebutkan hal berikut:

Biarkan menjadi variabel acak independen. Maka dan independen, di mana , jika dan hanya jika didistribusikan secara normal.n i = 1 a i x in i = 1 b i x i a i b i0 X iX1,,Xni=1naixii=1nbixiaibi0Xi

whuber
sumber
3
pasti ada kondisi seperti hilang? misalnya jika n = 2 dan tidak independen. a i = b i = 1 X 1 + X 2 X 1 + X 2<a,b>=0ai=bi=1 X1+X2X1+X2
robin girard
1
@robin tangkapan yang bagus. Saya telah bingung dengan quantifier implisit juga. Sayangnya, yang bisa saya akses adalah kutipan (ulasan) dari review, bukan buku. Akan menyenangkan untuk menemukannya di perpustakaan dan menjelajahinya ...
whuber
Ini terasa seperti generalisasi dari jawaban G. Jay Kerns (saat ini # 1).
vqv
Saya pikir Anda mungkin mencari kertas Lukacs & King (1954). Lihat jawaban ini di math.SE dengan tautan ke makalah yang disebutkan di atas.
kardinal
2
Di mana proposisi ini mengatakan "di mana ", apakah artinya untuk SETIAP set skalar di mana "? Saya benci melihat" di mana "digunakan sebagai pengganti" untuk setiap "atau" untuk beberapa "." Di mana "harus digunakan untuk menjelaskan notasi seseorang, seperti dalam" di mana adalah kecepatan cahaya dan adalah produk domestik bruto ", dll.a i b i0 c gaibi0aibi0cg
Michael Hardy
17

Distribusi Gaussian adalah satu-satunya distribusi penjumlahan stabil dengan varian terbatas.

shabbychef
sumber
8
Bahwa mereka stabil dan bahwa mereka adalah yang unik dengan varian yang terbatas, sama-sama dipaksakan kepada kita oleh CLT. Bagian yang menarik dari pernyataan ini adalah bahwa terdapat lainnya distribusi sum-stabil!
whuber
1
@whuber: memang! karakterisasi ini sedikit berubah, dan distribusi jumlah-stabil lainnya mungkin lebih penasaran.
shabbychef
@whuber sebenarnya, saya tidak melihat bagaimana CLT menyiratkan fakta ini. Tampaknya hanya untuk memberi tahu kita bahwa secara asimptotik , jumlah normal adalah normal, bukan jumlah terbatas apa pun yang terdistribusi secara normal. Atau apakah Anda harus menggunakan teorema Slutsky juga?
shabbychef
3
Mengadopsi standardisasi yang biasa, jumlah dua normals adalah jumlah dari satu distribusi normal X_0 ditambah distribusi pembatas dari seri X_1, X_2, ..., di mana jumlahnya adalah distribusi pembatas X_0, X_1, ..., yang oleh Lindeberg-Levy CLT normal.
whuber
17

Stein's Lemma memberikan karakterisasi yang sangat berguna. adalah standar Gaussian iff untuk semua fungsi kontinu dengan .E f ( Z ) = E Z f ( Z ) f E | f ( Z ) | < Z

Ef(Z)=EZf(Z)
fE|f(Z)|<
vqv
sumber
12

Teorema [Herschel-Maxwell]: Misalkan menjadi vektor acak di mana (i) proyeksi ke subruang ortogonal independen dan (ii) distribusi hanya bergantung pada panjang. Kemudian terdistribusi secara normal. Z Z ZZRnZZZ

Dikutip oleh George Cobb dalam Mengajar statistik: Beberapa ketegangan penting (Chili J. Statistik Vol. 2, No. 1, April 2011) di hal. 54.

Cobb menggunakan karakterisasi ini sebagai titik awal untuk menurunkan , , dan , tanpa menggunakan Kalkulus (atau teori probabilitas banyak). t Fχ2tF

whuber
sumber
9

Biarkan dan menjadi dua variabel acak independen dengan distribusi simetris yang sama sehinggaξηξ

P(|ξ+η2|t)P(|ξ|t).

Maka variabel acak ini adalah gaussian. (Jelas, jika dan berpusat gaussian, itu benar.)ξη

Ini adalah Teorema Bobkov-Houdre

robin girard
sumber
9

Ini bukan penokohan tetapi dugaan, yang berasal dari tahun 1917 dan disebabkan oleh Cantelli:

Jika adalah fungsi positif pada dan dan adalah variabel acak independen sehingga adalah normal, maka adalah konstanta hampir di mana-mana.fRXYN(0,1)X+f(X)Yf

Disebutkan oleh Gérard Letac di sini .

Did
sumber
itu baik bahwa Anda menyebutkannya! Saya tidak tahu intuisinya, bukan?
robin girard
@robin Inilah yang membuat dugaan ini begitu istimewa: pernyataan yang sepenuhnya elementer, beberapa pendekatan yang jelas yang gagal total (fungsi karakteristik), dan seseorang tidak dapat menangkap ... By the way, haruskah seseorang bertaruh pada dugaan itu benar atau salah? Bahkan itu tidak jelas (bagi saya).
Apakah
2
Jika Gérard Letac belum berhasil membuktikannya, itu bisa tetap menjadi dugaan terbuka selama beberapa saat ...!
Xi'an
@ Xi'an: Saya sepenuhnya setuju, tentu saja. (Tidak tahu Anda berkeliaran di perempat web ini ... Kabar baik bahwa Anda.)
Apakah
6
@ Xi'an Inilah pracetak dari Victor Kleptsyn dan Aline Kurtzmann dengan contoh berlawanan dengan dugaan Cantelli. Konstruksi menggunakan alat baru, yang penulis sebut sebagai transportasi massal Brown, dan menghasilkan fungsi diskontinyu . Para penulis menyatakan bahwa mereka percaya bahwa dugaan Cantelli berlaku jika seseorang bertanya bahwa adalah kontinu (milik mereka adalah campuran dari dua fungsi kontinu). ff
Apakah
8

Misalkan seseorang memperkirakan parameter lokasi menggunakan data iid . Jika adalah penaksir kemungkinan maksimum, maka distribusi sampling adalah Gaussian. Menurut Jaynes's Probability Theory: The Logic of Science hal. 202-4, beginilah Gauss awalnya berasal.{x1,...,xn}x¯

Cyan
sumber
Saya tidak yakin saya memahami ini sebagai karakterisasi dari distribusi normal, jadi saya mungkin kehilangan sesuatu. Bagaimana jika kami memiliki data Poisson iid dan ingin memperkirakan ? MLE adalah tetapi distribusi sampling dari bukan Gaussian - pertama, harus rasional; kedua, jika itu Gaussian, maka akan menjadi tapi itu . μx¯x¯x¯xiPoisson(nμ)
Silverfish
2
Rerata Poisson bukan parameter lokasi!
kjetil b halvorsen
6

Karakterisasi yang lebih khusus dari distribusi normal di antara kelas distribusi yang dapat dibagi secara tak terbatas disajikan dalam Steutel dan Van Harn (2004) .

Variabel acak tidak dapat tak terhingga memiliki distribusi normal jika dan hanya jika memenuhi X

lim supxlogP(|X|>x)xlog(x)=.

Hasil ini mencirikan distribusi normal dalam hal perilaku ekornya.

user10525
sumber
1
Bukti singkat dari batas yang dinyatakan adalah sebagai berikut: Jika adalah standar normal, maka sebagai , jadi . Tapi dan hasilnya berikut. Sketsa kasar untuk kasus Poisson tampaknya menunjukkan bahwa batas yang diberikan adalah , tapi saya tidak memeriksanya terlalu dekat. XxP(X>x)/φ(x)1xlogP(X>x)logφ(x)+logx02logφ(x)x2λ
kardinal
6

Dalam konteks pemulusan gambar (misalnya ruang skala ), Gaussian adalah satu-satunya kernel * yang dapat dipisahkan secara simetris secara rotasi.

Yaitu, jika kita memerlukan mana , maka simetri rotasi memerlukan yang setara dengan .

F[x,y]=f[x]f[y]
[x,y]=r[cosθ,sinθ]
Fθ=f[x]f[y]xθ+f[x]f[y]yθ=f[x]f[y]y+f[x]f[y]x=0f[x]xf[x]=f[y]yf[y]=const.
log[f[x]]=cx

Memerlukan bahwa menjadi kernel yang tepat kemudian membutuhkan konstanta menjadi negatif dan nilai awal positif, menghasilkan kernel Gaussian.f[x]


* Dalam konteks distribusi probabilitas, separable berarti independen, sedangkan dalam konteks pemfilteran gambar memungkinkan konvolusi 2D direduksi secara komputasional menjadi dua konvolusi 1D.

GeoMatt22
sumber
2
+1 Tetapi tidakkah ini mengikuti dari aplikasi langsung teorema Herschel-Maxwell dalam 2D?
whuber
@whuber Memang, entah bagaimana saya berhasil mengabaikan jawaban Anda ketika melihat melalui utas ini!
Amoeba berkata Reinstate Monica
@whuber Ya. Saya belum membaca utas lama ini secara mendetail, dan hanya menambahkan jawaban ini atas permintaan.
GeoMatt22
1
@amoeba lihat juga di sini .
GeoMatt22
3

Baru-baru ini Ejsmont [1] menerbitkan artikel dengan karakterisasi baru Gaussian:

Biarkan menjadi vektor acak independen dengan semua momen, di mana adalah - , dan biarkan statistik memiliki distribusi yang hanya bergantung pada , di mana dan . Kemudian independen dan memiliki distribusi normal yang sama dengan nol berarti dan untuk .(X1,,Xm,Y) and (Xm+1,,Xn,Z)Xii=1naiXi+Y+Zi=1nai2aiR1m<nXii { 1 , , n }cov(Xi,Y)=cov(Xi,Z)=0i{1,,n}

[1]. Ejsmont, Wiktor. "Karakterisasi distribusi normal dengan independensi sepasang vektor acak." Statistik & Probabilitas Surat 114 (2016): 1-5.

Daniel
sumber
1
Itu karakterisasi yang halus dan menarik. Terima kasih telah meningkatkan utas ini dengan membagikannya!
whuber
1

Fungsi karakteristiknya memiliki bentuk yang sama dengan pdf-nya. Saya tidak yakin distribusi lain yang melakukan itu.

Jason
sumber
4
Lihat jawaban saya ini untuk cara membangun variabel acak yang fungsinya sama dengan pdf-nya.
Dilip Sarwate
-1

Harapan plus minus deviasi standar adalah titik pelana fungsi.

Tal Galili
sumber
11
Ini adalah properti dari distribusi Normal, untuk memastikan, tetapi tidak mencirikannya , karena banyak distribusi lain juga memiliki properti ini.
whuber