Pertimbangkan jumlah distribusi seragam pada , atau . Mengapa puncak dalam PDF menghilang untuk ?

40

Saya sudah lama bertanya-tanya tentang yang ini; Saya merasa sedikit aneh betapa tiba-tiba itu terjadi. Pada dasarnya, mengapa kita hanya perlu tiga seragam untuk untuk memuluskan seperti itu? Dan mengapa smoothing-out terjadi begitu cepat?Zn

Z2 :

2

Z3 :

3

(gambar dicuri tanpa malu-malu dari blog John D. Cook: http://www.johndcook.com/blog/2009/02/12/sums-of-uniform-random-values/ )

Mengapa tidak butuh, katakanlah, empat seragam? Atau lima? Atau...?

tetragrammaton
sumber
11
baik, untuk menjadi sangat sederhana untuk menjadi mudah, karena jumlah dari 3 seragam memiliki segmen kuadrat di pf-nya, dan begitu Anda mendapatkan dua atau lebih seragam Anda memiliki puncak pada rata-rata. Puncak kuadrat adalah "halus" ... dan gabungan antara potongan kuadrat berada pada 1 dan 2, sehingga tidak dapat berbelit - belit pada 1,5; ada cara lain untuk sampai pada kesimpulan yang sama
Glen_b

Jawaban:

71

Kita dapat mengambil berbagai pendekatan untuk ini, yang salah satu di antaranya mungkin tampak intuitif bagi sebagian orang dan kurang intuitif bagi yang lain. Untuk mengakomodasi variasi seperti itu, jawaban ini mensurvei beberapa pendekatan seperti itu, yang meliputi divisi utama dari pemikiran matematika - analisis (tak terbatas dan sangat kecil), geometri / topologi (hubungan spasial), dan aljabar (pola formal manipulasi simbolik) - sebagai serta probabilitas itu sendiri. Ini memuncak dalam pengamatan yang menyatukan keempat pendekatan, menunjukkan ada pertanyaan asli untuk dijawab di sini, dan menunjukkan dengan tepat apa masalahnya. Setiap pendekatan menyediakan, dengan caranya sendiri, wawasan yang lebih dalam tentang sifat bentuk fungsi distribusi probabilitas dari jumlah variabel seragam independen.


Latar Belakang

The Uniform distribusi[0,1] memiliki beberapa deskripsi dasar. Ketika memiliki distribusi seperti itu,X

  1. Peluang terletak pada himpunan terukur hanyalah ukuran (panjang) , ditulis.A A [ 0 , 1 ] | A [ 0 , 1 ] |XAA[0,1]|A[0,1]|

  2. Dari sini langsung bahwa fungsi distribusi kumulatif (CDF) adalah

    FX(x)=Pr(Xx)=|(,x][0,1]|=|[0,min(x,1)]|={0x<0x0x11x>1.

    CDF

  3. Fungsi probabilitas kerapatan (PDF), yang merupakan turunan dari CDF, adalah untuk dan sebaliknya. (Tidak ditentukan pada dan )fX(x)=10x1fX(x)=001

    PDF


Intuisi dari Fungsi Karakteristik (Analisis)

Fungsi karakteristik (CF) dari setiap variabel acak adalah harapan (di mana adalah unit imajiner, ). Menggunakan PDF dari distribusi seragam yang dapat kita hitungXexp(itX)ii2=1

ϕX(t)=exp(itx)fX(x)dx=01exp(itx)dx=exp(itx)it|x=0x=1=exp(it)1it.

CF adalah (versi dari) Transformasi Fourier dari PDF, . Teorema paling mendasar tentang transformasi Fourier adalah:ϕ(t)=f^(t)

  • CF dari sejumlah variabel independen adalah produk CF mereka.X+Y

  • Ketika PDF asli kontinu dan dibatasi, dapat dipulihkan dari CF oleh versi Fourier transform yang terkait erat,fXfϕ

f(x)=ϕˇ(x)=12πexp(ixt)ϕ(t)dt.
  • Ketika dapat dibedakan, turunannya dapat dihitung dengan tanda integral:f

    f(x)=ddx12πexp(ixt)ϕ(t)dt=i2πtexp(ixt)ϕ(t)dt.

    Agar ini didefinisikan dengan baik, integral terakhir harus benar-benar bertemu; itu adalah,

    |texp(ixt)ϕ(t)|dt=|t||ϕ(t)|dt

    harus konvergen ke nilai yang terbatas. Sebaliknya, ketika konvergen bertemu, turunannya ada di mana-mana berdasarkan rumus inversi ini.

Sekarang jelas bagaimana persisnya diferensiasi PDF untuk jumlah variabel seragam: dari peluru pertama, CF dari jumlah variabel iid adalah CF yang salah satunya dinaikkan menjadi kekuatan , di sini sama dengan . Pembilangnya dibatasi (terdiri dari gelombang sinus) sedangkan penyebutnya adalah . Kita dapat melipatgandakan integrasi seperti itu dengan dan itu akan tetap menyatu secara absolut ketika dan bertemu secara kondisional ketika . Dengan demikian, aplikasi berulang dari peluru ketiga menunjukkan bahwa PDF untuk jumlah varian seragam akan terus menerusnnth(exp(it)1)n/(it)nO(tn)tss<n1s=n1nn2kali dapat dibedakan dan, di sebagian besar tempat, akan kali dapat dibedakan.n1

CF untuk n = 10

Kurva berbayang biru adalah plot log-log dari nilai absolut dari bagian nyata CF dari jumlah iid seragam seragam. Garis merah putus-putus adalah asimtot; kemiringannya adalah , menunjukkan bahwa PDF adalah kali dapat dibedakan. Untuk referensi, kurva abu-abu memplot bagian nyata CF untuk fungsi Gaussian yang berbentuk serupa (PDF normal).n=1010102=8


Intuisi dari Probabilitas

Biarkan dan menjadi variabel acak independen di mana memiliki distribusi Uniform . Pertimbangkan interval sempit menguraikan peluang bahwa menjadi peluang bahwa cukup dekat dengan interval ini dikali peluang bahwa adalah ukuran yang tepat untuk menempatkan dalam interval ini, mengingat bahwa cukup dekat:YXX[0,1](t,t+dt]X+Y(t,t+dt]YXX+YY

fX+Y(t)dt=Pr(X+Y(t,t+dt])=Pr(X+Y(t,t+dt]|Y(t1,t+dt])Pr(Y(t1,t+dt])=Pr(X(tY,tY+dt]|Y(t1,t+dt])(FY(t+dt)FY(t1))=1dt(FY(t+dt)FY(t1)).

Kesetaraan akhir berasal dari ekspresi untuk PDF dari . Membagi kedua sisi dengan dan mengambil batas sebagai memberikanXdtdt0

fX+Y(t)=FY(t)FY(t1).

Dengan kata lain, menambahkan Seragam variabel ke sembarang variabel mengubah pdf menjadi CDF . Karena PDF adalah turunan dari CDF, ini menyiratkan bahwa setiap kali kami menambahkan variabel seragam independen ke , hasil PDF satu kali lebih dapat dibedakan dari sebelumnya.[0,1]XYfYFY(t)FY(t1)Y

Mari kita menerapkan wawasan ini, dimulai dengan variabel seragam . PDF asli tidak dapat dibedakan pada atau : itu terputus-putus di sana. PDF dari tidak terdiferensiasi di , , atau , tetapi harus terus menerus pada titik-titik, karena itu adalah perbedaan integral dari PDF dari . Tambahkan variabel seragam independen lain : PDF dapat dibedakan pada , , , dan tetapi tidak harus memiliki yang keduaY01Y+X012YX2Y+X+X2 0123turunan pada titik-titik tersebut. Dan seterusnya.


Intuisi dari Geometri

CDF pada dari jumlah iid uniform variates sama dengan volume unit hypercube terletak di dalam ruang setengah . Situasi untuk variasi ditunjukkan di sini, dengan ditetapkan pada , , dan kemudian .tn[0,1]nx1+x2++xntn=3t1/23/25/2

Kubus 3D

Ketika berkembang dari hingga , hyperplane melintasi simpul pada , . Pada setiap kali bentuk penampang berubah: pada gambar itu pertama adalah segitiga (a -simpleks), kemudian segi enam, lalu segitiga lagi. Mengapa PDF tidak memiliki tikungan tajam pada nilai ?t0nHn(t):x1+x2++xn=tt=0t=1,,t=n2t

Untuk memahami hal ini, pertama-tama pertimbangkan nilai-nilai kecil . Di sini, hyperplane memotong -simplex. Semua dimensi simpleks berbanding lurus dengan , di mana "area" -nya sebanding dengan . Beberapa notasi untuk ini akan berguna nanti. Biarkan menjadi "fungsi unit step,"tHn(t)n1n1ttn1θ

θ(x)={0x<01x0.

Jika bukan karena adanya sudut-sudut lain dari hypercube, penskalaan ini akan berlanjut tanpa batas. Plot area -simplex akan terlihat seperti kurva biru solid di bawah ini: nol pada nilai negatif dan sama denganpada yang positif, ditulis dengan nyaman. Ia memiliki "ketegaran" urutan pada titik asal, dalam arti bahwa semua turunan melalui urutan ada dan kontinu, tetapi turunan kiri dan kanan urutan ada tetapi tidak setuju pada titik asal. .n1tn1/(n1)!θ(t)tn1/(n1)!n2n3n2

(Kurva lain yang ditunjukkan pada gambar ini adalah (Merah), (Emas), dan (Hitam). Peran mereka dalam kasus dibahas lebih lanjut di bawah.)3θ(t1)(t1)2/2!3θ(t2)(t2)2/2!θ(t3)(t3)2/2!n=3

Plot area sederhana

Untuk memahami apa yang terjadi ketika melintasi , mari kita periksa secara detail kasus , di mana semua geometri terjadi pada bidang. Kami dapat melihat unit "kubus" (sekarang hanya persegi) sebagai kombinasi linear kuadran , seperti yang ditunjukkan di sini:t1n=2

Kuadran

Kuadran pertama muncul di panel kiri bawah, berwarna abu-abu. Nilai adalah , menentukan garis diagonal yang ditunjukkan di kelima panel. CDF sama dengan area kuning yang ditunjukkan di kanan. Area kuning ini terdiri dari:t1.5

  1. Area abu-abu segitiga di panel kiri bawah,

  2. minus area hijau segitiga di panel kiri atas,

  3. minus area merah segitiga di panel tengah rendah,

  4. ditambah area biru di panel tengah atas (tetapi tidak ada area seperti itu, juga tidak akan ada hingga melebihi ).t2

Setiap area ini adalah area segitiga. Skala pertama seperti , dua berikutnya adalah nol untuk dan skala seperti , dan yang terakhir adalah nol untuk dan sisik seperti . Analisis geometrik ini menetapkan bahwa CDF sebanding dengan = ; setara, PDF sebanding dengan jumlah dari tiga fungsi , , dan2n=4tn=t2t<1(t1)n=(t1)2t<2(t2)nθ(t)t2θ(t1)(t1)2θ(t1)(t1)2+θ(t2)(t2)2θ(t)t22θ(t1)(t1)2+θ(t2)(t2)2θ(t)t2θ(t1)(t1)θ(t2)(t2)(masing-masing skala linear ketika ). Panel kiri gambar ini menunjukkan grafik mereka: jelas, mereka semua adalah versi dari grafik asli , tetapi (a) digeser oleh , , dan unit ke kanan dan (b) ditulis ulang oleh , , dan , masing-masing.n=2θ(t)t012121

Grafik untuk n = 2

Panel kanan menunjukkan jumlah grafik ini (kurva hitam solid, dinormalisasi untuk memiliki satuan luas: ini justru PDF yang tampak seperti sudut yang ditunjukkan dalam pertanyaan asli.

Sekarang kita dapat memahami sifat "kekusutan" dalam PDF dari setiap jumlah variabel seragam iid. Mereka semua persis seperti "ketegaran" yang terjadi pada dalam fungsi , mungkin diubah skala, dan bergeser ke bilangan bulat sesuai dengan tempat hyperplane melintasi simpul dari hypercube. Untuk , ini adalah perubahan arah yang terlihat: turunan kanan pada adalah sedangkan turunan kirinya adalah . Untuk , ini adalah kontinu0θ(t)tn11,2,,nHn(t)n=2θ(t)t001n=3perubahan arah, tetapi perubahan mendadak (terputus-putus) dalam turunan kedua. Untuk umum , akan ada turunan kontinu melalui urutan tetapi diskontinuitas dalam turunan .nn2n1st


Intuisi dari Manipulasi Aljabar

Integrasi untuk menghitung CF, bentuk probabilitas kondisional dalam analisis probabilistik, dan sintesis hypercube sebagai kombinasi linear kuadran semua menyarankan untuk kembali ke distribusi seragam asli dan menyatakan kembali sebagai kombinasi linear dari hal-hal sederhana. . Memang, PDF-nya bisa ditulis

fX(x)=θ(x)θ(x1).

Mari kita perkenalkan operator shift : ia bekerja pada fungsi apa saja dengan menggeser grafiknya satu unit ke kanan:Δf

(Δf)(x)=f(x1).

Maka, secara formal, untuk PDF dari variabel seragam dapat kita tulisX

fX=(1Δ)θ.

PDF dari jumlah seragam iid adalah konvolusi dari dengan dirinya sendiri kali. Ini mengikuti dari definisi sejumlah variabel acak: konvolusi dua fungsi dan adalah fungsinfXnfg

(fg)(x)=f(xy)g(y)dy.

Sangat mudah untuk memverifikasi bahwa konvolusi berjalan dengan . Ubah saja variabel integrasi dari ke :Δyy+1

(f(Δg))=f(xy)(Δg)(y)dy=f(xy)g(y1)dy=f((x1)y)g(y)dy=(Δ(fg))(x).

Untuk PDF dari jumlah seragam iid, kita sekarang dapat melanjutkan aljabar untuk menulisn

f=fXn=((1Δ)θ)n=(1Δ)nθn

(di mana "power" menunjukkan konvolusi berulang, bukan perkalian secara langsung!). Sekarang adalah integrasi, langsung dasar, memberinθn

θn(x)=θ(x)xn1n1!.

Sisanya adalah aljabar, karena Teorema Binomial berlaku (seperti halnya dalam aljabar komutatif apa pun atas real):

f=(1Δ)nθn=i=0n(1)i(ni)Δiθn.

Karena hanya menggeser argumennya oleh , ini menunjukkan PDF sebagai kombinasi linear dari versi bergeser dari , persis seperti yang kita simpulkan secara geometris:Δiifθ(x)xn1

f(x)=1(n1)!i=0n(1)i(ni)(xi)n1θ(xi).

(John Cook mengutip formula ini nanti dalam posting blog-nya, menggunakan notasi untuk .)(xi)+n1(xi)n1θ(xi)

Oleh karena itu, karena adalah fungsi yang lancar di mana-mana, perilaku singular dari PDF akan terjadi hanya di tempat-tempat di mana tunggal (jelas hanya ) dan di tempat-tempat itu bergeser ke kanan sebesar . Sifat perilaku tunggal itu - tingkat kelancaran - karena itu akan sama di semua lokasi .xn1θ(x)01,2,,nn+1

Menggambarkan ini adalah gambar untuk , menunjukkan (di panel kiri) istilah individu dalam jumlah dan (di panel kanan) jumlah parsial, yang berpuncak pada jumlah itu sendiri (kurva hitam solid):n=8

Plot untuk n = 8


Komentar Penutupan

Hal ini berguna untuk dicatat bahwa pendekatan terakhir ini akhirnya menghasilkan kompak, ekspresi praktis untuk menghitung PDF dari jumlah variabel seragam iid. (Formula untuk CDF diperoleh dengan cara yang sama.)n

Teorema Limit Pusat tidak banyak bicara di sini. Bagaimanapun, sejumlah variabel Binomial iid menyatu ke distribusi Normal, tetapi jumlah itu selalu terpisah: ia bahkan tidak pernah memiliki PDF sama sekali! Kita seharusnya tidak mengharapkan intuisi tentang "ketegaran" atau ukuran pembeda lain dari PDF yang berasal dari CLT.

whuber
sumber
12
(+1) Fantastis! Sekarang, berapa lama bagi Anda untuk menyatukan semua ini ?!
kardinal
13
@ Cardinal Ini adalah pertanyaan terakhir yang saya baca sebelum kehilangan kekuatan Senin lalu. Selama minggu berikutnya, malam gelap yang panjang memberikan kesempatan untuk memikirkannya :-) dan, untuk hiburan, untuk mengembangkan beberapa jawaban. Setelah kekuatan dipulihkan akhir pekan lalu, itu hanya masalah menemukan waktu untuk membuat ilustrasi dan menulis semuanya (yang membutuhkan waktu lebih lama dari yang diharapkan, saya akui). Saya berharap bahwa mungkin beberapa utas ini dapat berfungsi sebagai referensi untuk pertanyaan terkait di masa depan tentang jumlah variabel acak.
whuber
1
Wow. Saya berharap bisa 'menyukai' jawaban ini .
Rhubbarb
2
Whuber, ini benar-benar luar biasa. Saya tidak pernah menyadari seberapa dalam pertanyaan sederhana seperti itu. Butuh beberapa saat untuk mendapatkan jawaban Anda, tetapi untuk sekarang, terima kasih banyak!
tetragrammaton
6
Saya akan melanggar kebijakan SE pada komentar, dengan mengatakan bahwa kami (semua crossvalidate.com) harus menyuap perusahaan listrik Anda untuk lebih sering memutus kekuasaan :)
mpiktas
1

Anda bisa berpendapat bahwa fungsi kerapatan probabilitas dari variabel acak seragam adalah terbatas,

jadi tidak terpisahkan fungsi kepadatan kumulatif dari variabel acak seragam kontinu,

jadi fungsi kepadatan probabilitas dari jumlah dua variabel acak seragam adalah kontinu,

jadi tidak terpisahkan fungsi kepadatan kumulatif dari jumlah dua variabel acak yang seragam adalah halus (dapat dibedakan terus menerus)

jadi fungsi kerapatan probabilitas dari jumlah tiga variabel acak seragam adalah lancar.

Henry
sumber
1

Saya pikir hal yang lebih mengejutkan adalah Anda mendapatkan puncak yang tajam untuk . n=2

Teorema Limit Pusat mengatakan bahwa untuk ukuran sampel yang cukup besar, distribusi rata-rata (dan jumlahnya hanya rata-rata kali , konstanta tetap untuk setiap grafik) akan mendekati normal. Ternyata distribusi seragam berperilaku sangat baik sehubungan dengan CLT (simetris, tidak ada ekor yang berat (juga tidak banyak ekor), tidak ada kemungkinan pencilan), jadi untuk seragam ukuran sampel perlu "cukup besar" "tidak terlalu besar (sekitar 5 atau 6 untuk perkiraan yang baik), Anda sudah melihat perkiraan OK pada .nn=3

Greg Snow
sumber