Saya sudah lama bertanya-tanya tentang yang ini; Saya merasa sedikit aneh betapa tiba-tiba itu terjadi. Pada dasarnya, mengapa kita hanya perlu tiga seragam untuk untuk memuluskan seperti itu? Dan mengapa smoothing-out terjadi begitu cepat?
:
:
(gambar dicuri tanpa malu-malu dari blog John D. Cook: http://www.johndcook.com/blog/2009/02/12/sums-of-uniform-random-values/ )
Mengapa tidak butuh, katakanlah, empat seragam? Atau lima? Atau...?
normal-distribution
mathematical-statistics
uniform
central-limit-theorem
tetragrammaton
sumber
sumber
Jawaban:
Kita dapat mengambil berbagai pendekatan untuk ini, yang salah satu di antaranya mungkin tampak intuitif bagi sebagian orang dan kurang intuitif bagi yang lain. Untuk mengakomodasi variasi seperti itu, jawaban ini mensurvei beberapa pendekatan seperti itu, yang meliputi divisi utama dari pemikiran matematika - analisis (tak terbatas dan sangat kecil), geometri / topologi (hubungan spasial), dan aljabar (pola formal manipulasi simbolik) - sebagai serta probabilitas itu sendiri. Ini memuncak dalam pengamatan yang menyatukan keempat pendekatan, menunjukkan ada pertanyaan asli untuk dijawab di sini, dan menunjukkan dengan tepat apa masalahnya. Setiap pendekatan menyediakan, dengan caranya sendiri, wawasan yang lebih dalam tentang sifat bentuk fungsi distribusi probabilitas dari jumlah variabel seragam independen.
Latar Belakang
The Uniform distribusi[0,1] memiliki beberapa deskripsi dasar. Ketika memiliki distribusi seperti itu,X
Peluang terletak pada himpunan terukur hanyalah ukuran (panjang) , ditulis.A A ∩ [ 0 , 1 ] | A ∩ [ 0 , 1 ] |X A A∩[0,1] |A∩[0,1]|
Dari sini langsung bahwa fungsi distribusi kumulatif (CDF) adalah
Fungsi probabilitas kerapatan (PDF), yang merupakan turunan dari CDF, adalah untuk dan sebaliknya. (Tidak ditentukan pada dan )fX(x)=1 0≤x≤1 fX(x)=0 0 1
Intuisi dari Fungsi Karakteristik (Analisis)
Fungsi karakteristik (CF) dari setiap variabel acak adalah harapan (di mana adalah unit imajiner, ). Menggunakan PDF dari distribusi seragam yang dapat kita hitungX exp(itX) i i2=−1
CF adalah (versi dari) Transformasi Fourier dari PDF, . Teorema paling mendasar tentang transformasi Fourier adalah:ϕ(t)=f^(t)
CF dari sejumlah variabel independen adalah produk CF mereka.X+Y
Ketika PDF asli kontinu dan dibatasi, dapat dipulihkan dari CF oleh versi Fourier transform yang terkait erat,f X f ϕ
Ketika dapat dibedakan, turunannya dapat dihitung dengan tanda integral:f
Agar ini didefinisikan dengan baik, integral terakhir harus benar-benar bertemu; itu adalah,
harus konvergen ke nilai yang terbatas. Sebaliknya, ketika konvergen bertemu, turunannya ada di mana-mana berdasarkan rumus inversi ini.
Sekarang jelas bagaimana persisnya diferensiasi PDF untuk jumlah variabel seragam: dari peluru pertama, CF dari jumlah variabel iid adalah CF yang salah satunya dinaikkan menjadi kekuatan , di sini sama dengan . Pembilangnya dibatasi (terdiri dari gelombang sinus) sedangkan penyebutnya adalah . Kita dapat melipatgandakan integrasi seperti itu dengan dan itu akan tetap menyatu secara absolut ketika dan bertemu secara kondisional ketika . Dengan demikian, aplikasi berulang dari peluru ketiga menunjukkan bahwa PDF untuk jumlah varian seragam akan terus menerusn nth (exp(it)−1)n/(it)n O(tn) ts s<n−1 s=n−1 n n−2 kali dapat dibedakan dan, di sebagian besar tempat, akan kali dapat dibedakan.n−1
Kurva berbayang biru adalah plot log-log dari nilai absolut dari bagian nyata CF dari jumlah iid seragam seragam. Garis merah putus-putus adalah asimtot; kemiringannya adalah , menunjukkan bahwa PDF adalah kali dapat dibedakan. Untuk referensi, kurva abu-abu memplot bagian nyata CF untuk fungsi Gaussian yang berbentuk serupa (PDF normal).n=10 −10 10−2=8
Intuisi dari Probabilitas
Biarkan dan menjadi variabel acak independen di mana memiliki distribusi Uniform . Pertimbangkan interval sempit menguraikan peluang bahwa menjadi peluang bahwa cukup dekat dengan interval ini dikali peluang bahwa adalah ukuran yang tepat untuk menempatkan dalam interval ini, mengingat bahwa cukup dekat:Y X X [0,1] (t,t+dt] X+Y∈(t,t+dt] Y X X+Y Y
Kesetaraan akhir berasal dari ekspresi untuk PDF dari . Membagi kedua sisi dengan dan mengambil batas sebagai memberikanX dt dt→0
Dengan kata lain, menambahkan Seragam variabel ke sembarang variabel mengubah pdf menjadi CDF . Karena PDF adalah turunan dari CDF, ini menyiratkan bahwa setiap kali kami menambahkan variabel seragam independen ke , hasil PDF satu kali lebih dapat dibedakan dari sebelumnya.[0,1] X Y fY FY(t)−FY(t−1) Y
Mari kita menerapkan wawasan ini, dimulai dengan variabel seragam . PDF asli tidak dapat dibedakan pada atau : itu terputus-putus di sana. PDF dari tidak terdiferensiasi di , , atau , tetapi harus terus menerus pada titik-titik, karena itu adalah perbedaan integral dari PDF dari . Tambahkan variabel seragam independen lain : PDF dapat dibedakan pada , , , dan tetapi tidak harus memiliki yang keduaY 0 1 Y+X 0 1 2 Y X2 Y+X+X2 0 1 2 3 turunan pada titik-titik tersebut. Dan seterusnya.
Intuisi dari Geometri
CDF pada dari jumlah iid uniform variates sama dengan volume unit hypercube terletak di dalam ruang setengah . Situasi untuk variasi ditunjukkan di sini, dengan ditetapkan pada , , dan kemudian .t n [0,1]n x1+x2+⋯+xn≤t n=3 t 1/2 3/2 5/2
Ketika berkembang dari hingga , hyperplane melintasi simpul pada , . Pada setiap kali bentuk penampang berubah: pada gambar itu pertama adalah segitiga (a -simpleks), kemudian segi enam, lalu segitiga lagi. Mengapa PDF tidak memiliki tikungan tajam pada nilai ?t 0 n Hn(t):x1+x2+⋯+xn=t t=0 t=1,…,t=n 2 t
Untuk memahami hal ini, pertama-tama pertimbangkan nilai-nilai kecil . Di sini, hyperplane memotong -simplex. Semua dimensi simpleks berbanding lurus dengan , di mana "area" -nya sebanding dengan . Beberapa notasi untuk ini akan berguna nanti. Biarkan menjadi "fungsi unit step,"t Hn(t) n−1 n−1 t tn−1 θ
Jika bukan karena adanya sudut-sudut lain dari hypercube, penskalaan ini akan berlanjut tanpa batas. Plot area -simplex akan terlihat seperti kurva biru solid di bawah ini: nol pada nilai negatif dan sama denganpada yang positif, ditulis dengan nyaman. Ia memiliki "ketegaran" urutan pada titik asal, dalam arti bahwa semua turunan melalui urutan ada dan kontinu, tetapi turunan kiri dan kanan urutan ada tetapi tidak setuju pada titik asal. .n−1 tn−1/(n−1)! θ(t)tn−1/(n−1)! n−2 n−3 n−2
(Kurva lain yang ditunjukkan pada gambar ini adalah (Merah), (Emas), dan (Hitam). Peran mereka dalam kasus dibahas lebih lanjut di bawah.)−3θ(t−1)(t−1)2/2! 3θ(t−2)(t−2)2/2! −θ(t−3)(t−3)2/2! n=3
Untuk memahami apa yang terjadi ketika melintasi , mari kita periksa secara detail kasus , di mana semua geometri terjadi pada bidang. Kami dapat melihat unit "kubus" (sekarang hanya persegi) sebagai kombinasi linear kuadran , seperti yang ditunjukkan di sini:t 1 n=2
Kuadran pertama muncul di panel kiri bawah, berwarna abu-abu. Nilai adalah , menentukan garis diagonal yang ditunjukkan di kelima panel. CDF sama dengan area kuning yang ditunjukkan di kanan. Area kuning ini terdiri dari:t 1.5
Area abu-abu segitiga di panel kiri bawah,
minus area hijau segitiga di panel kiri atas,
minus area merah segitiga di panel tengah rendah,
ditambah area biru di panel tengah atas (tetapi tidak ada area seperti itu, juga tidak akan ada hingga melebihi ).t 2
Setiap area ini adalah area segitiga. Skala pertama seperti , dua berikutnya adalah nol untuk dan skala seperti , dan yang terakhir adalah nol untuk dan sisik seperti . Analisis geometrik ini menetapkan bahwa CDF sebanding dengan = ; setara, PDF sebanding dengan jumlah dari tiga fungsi , , dan2n=4 tn=t2 t<1 (t−1)n=(t−1)2 t<2 (t−2)n θ(t)t2−θ(t−1)(t−1)2−θ(t−1)(t−1)2+θ(t−2)(t−2)2 θ(t)t2−2θ(t−1)(t−1)2+θ(t−2)(t−2)2 θ(t)t −2θ(t−1)(t−1) θ(t−2)(t−2) (masing-masing skala linear ketika ). Panel kiri gambar ini menunjukkan grafik mereka: jelas, mereka semua adalah versi dari grafik asli , tetapi (a) digeser oleh , , dan unit ke kanan dan (b) ditulis ulang oleh , , dan , masing-masing.n=2 θ(t)t 0 1 2 1 −2 1
Panel kanan menunjukkan jumlah grafik ini (kurva hitam solid, dinormalisasi untuk memiliki satuan luas: ini justru PDF yang tampak seperti sudut yang ditunjukkan dalam pertanyaan asli.
Sekarang kita dapat memahami sifat "kekusutan" dalam PDF dari setiap jumlah variabel seragam iid. Mereka semua persis seperti "ketegaran" yang terjadi pada dalam fungsi , mungkin diubah skala, dan bergeser ke bilangan bulat sesuai dengan tempat hyperplane melintasi simpul dari hypercube. Untuk , ini adalah perubahan arah yang terlihat: turunan kanan pada adalah sedangkan turunan kirinya adalah . Untuk , ini adalah kontinu0 θ(t)tn−1 1,2,…,n Hn(t) n=2 θ(t)t 0 0 1 n=3 perubahan arah, tetapi perubahan mendadak (terputus-putus) dalam turunan kedua. Untuk umum , akan ada turunan kontinu melalui urutan tetapi diskontinuitas dalam turunan .n n−2 n−1st
Intuisi dari Manipulasi Aljabar
Integrasi untuk menghitung CF, bentuk probabilitas kondisional dalam analisis probabilistik, dan sintesis hypercube sebagai kombinasi linear kuadran semua menyarankan untuk kembali ke distribusi seragam asli dan menyatakan kembali sebagai kombinasi linear dari hal-hal sederhana. . Memang, PDF-nya bisa ditulis
Mari kita perkenalkan operator shift : ia bekerja pada fungsi apa saja dengan menggeser grafiknya satu unit ke kanan:Δ f
Maka, secara formal, untuk PDF dari variabel seragam dapat kita tulisX
PDF dari jumlah seragam iid adalah konvolusi dari dengan dirinya sendiri kali. Ini mengikuti dari definisi sejumlah variabel acak: konvolusi dua fungsi dan adalah fungsin fX n f g
Sangat mudah untuk memverifikasi bahwa konvolusi berjalan dengan . Ubah saja variabel integrasi dari ke :Δ y y+1
Untuk PDF dari jumlah seragam iid, kita sekarang dapat melanjutkan aljabar untuk menulisn
(di mana "power" menunjukkan konvolusi berulang, bukan perkalian secara langsung!). Sekarang adalah integrasi, langsung dasar, memberi⋆n θ⋆n
Sisanya adalah aljabar, karena Teorema Binomial berlaku (seperti halnya dalam aljabar komutatif apa pun atas real):
Karena hanya menggeser argumennya oleh , ini menunjukkan PDF sebagai kombinasi linear dari versi bergeser dari , persis seperti yang kita simpulkan secara geometris:Δi i f θ(x)xn−1
(John Cook mengutip formula ini nanti dalam posting blog-nya, menggunakan notasi untuk .)(x−i)n−1+ (x−i)n−1θ(x−i)
Oleh karena itu, karena adalah fungsi yang lancar di mana-mana, perilaku singular dari PDF akan terjadi hanya di tempat-tempat di mana tunggal (jelas hanya ) dan di tempat-tempat itu bergeser ke kanan sebesar . Sifat perilaku tunggal itu - tingkat kelancaran - karena itu akan sama di semua lokasi .xn−1 θ(x) 0 1,2,…,n n+1
Menggambarkan ini adalah gambar untuk , menunjukkan (di panel kiri) istilah individu dalam jumlah dan (di panel kanan) jumlah parsial, yang berpuncak pada jumlah itu sendiri (kurva hitam solid):n=8
Komentar Penutupan
Hal ini berguna untuk dicatat bahwa pendekatan terakhir ini akhirnya menghasilkan kompak, ekspresi praktis untuk menghitung PDF dari jumlah variabel seragam iid. (Formula untuk CDF diperoleh dengan cara yang sama.)n
Teorema Limit Pusat tidak banyak bicara di sini. Bagaimanapun, sejumlah variabel Binomial iid menyatu ke distribusi Normal, tetapi jumlah itu selalu terpisah: ia bahkan tidak pernah memiliki PDF sama sekali! Kita seharusnya tidak mengharapkan intuisi tentang "ketegaran" atau ukuran pembeda lain dari PDF yang berasal dari CLT.
sumber
Anda bisa berpendapat bahwa fungsi kerapatan probabilitas dari variabel acak seragam adalah terbatas,
jadi tidak terpisahkan fungsi kepadatan kumulatif dari variabel acak seragam kontinu,
jadi fungsi kepadatan probabilitas dari jumlah dua variabel acak seragam adalah kontinu,
jadi tidak terpisahkan fungsi kepadatan kumulatif dari jumlah dua variabel acak yang seragam adalah halus (dapat dibedakan terus menerus)
jadi fungsi kerapatan probabilitas dari jumlah tiga variabel acak seragam adalah lancar.
sumber
Saya pikir hal yang lebih mengejutkan adalah Anda mendapatkan puncak yang tajam untuk .n=2
Teorema Limit Pusat mengatakan bahwa untuk ukuran sampel yang cukup besar, distribusi rata-rata (dan jumlahnya hanya rata-rata kali , konstanta tetap untuk setiap grafik) akan mendekati normal. Ternyata distribusi seragam berperilaku sangat baik sehubungan dengan CLT (simetris, tidak ada ekor yang berat (juga tidak banyak ekor), tidak ada kemungkinan pencilan), jadi untuk seragam ukuran sampel perlu "cukup besar" "tidak terlalu besar (sekitar 5 atau 6 untuk perkiraan yang baik), Anda sudah melihat perkiraan OK pada .n n=3
sumber