Variabel acak seragam sebagai jumlah dari dua variabel acak

18

Diambil dari Grimmet dan Stirzaker :

Tunjukkan bahwa tidak dapat menjadi kasus bahwa U=X+Y mana terdistribusi secara seragam pada [0,1] dan dan adalah independen dan terdistribusi secara identik. Anda tidak boleh berasumsi bahwa X dan Y adalah variabel kontinu.UXY

Sebuah bukti sederhana dengan mencukupi kontradiksi untuk kasus di mana , diasumsikan diskrit dengan alasan bahwa itu selalu mungkin untuk menemukan dan sehingga sedangkan .XYuuP(Uu+u)P(Uu)P(X+Yu)=P(X+Yu+u)

Namun bukti ini tidak mencakup yang benar-benar kontinu atau kontinu tunggal. Petunjuk / Komentar / Kritik?X,Y

hak cipta
sumber
3
Petunjuk : Fungsi karakteristik adalah teman Anda.
kardinal
1
X dan Y adalah iid sehingga fungsi karakteristiknya harus identik. Anda perlu menggunakan fungsi karakteristik bukan fungsi menghasilkan momen - mgf tidak dijamin ada untuk X, jadi menunjukkan mgf memiliki properti yang mustahil tidak berarti tidak ada X seperti itu. Semua RV memiliki fungsi karakteristik, jadi jika Anda menunjukkan bahwa memiliki properti yang mustahil maka tidak ada X.
Silverfish
1
Jika distribusi X dan Y memiliki atom , katakan bahwa P{X=a}=P{Y=a}=b>0 , maka P{X+Y=2a}b2>0 dan kemudian X+Y tidak dapat didistribusikan secara seragam pada [0,1]. Dengan demikian, tidak perlu mempertimbangkan kasus distribusi X dan Y memiliki atom.
Dilip Sarwate

Jawaban:

13

Hasilnya dapat dibuktikan dengan gambar: area abu-abu yang terlihat menunjukkan bahwa distribusi seragam tidak dapat didekomposisi sebagai jumlah dari dua variabel independen yang didistribusikan secara identik.

Notasi

Biarkan dan Y menjadi iid sehingga X + Y memiliki distribusi seragam pada [ 0 , 1 ] . Ini berarti bahwa untuk semua 0 a b 1 ,XYX+Y[0,1]0ab1

Pr(a<X+Yb)=ba.

Dukungan penting dari distribusi umum dan Y karena itu [ 0 , 1 / 2 ] (karena jika tidak akan ada kemungkinan positif yang X + Y kebohongan luar [ 0 , 1 ] ).XY[0,1/2]X+Y[0,1]

Gambar

Mari . Renungkan diagram ini yang menunjukkan bagaimana jumlah variabel acak dihitung:0<ϵ<1/4

Figure

Distribusi probabilitas yang mendasari adalah yang bersama untuk . Probabilitas dari setiap kejadian a < X + Y b diberikan oleh probabilitas total yang tercakup oleh pita diagonal yang membentang di antara garis x + y = a dan x + y = b . Tiga band-band seperti ditunjukkan: dari 0 ke ε , muncul sebagai segitiga biru kecil di kiri bawah; dari 1 / 2 - ε untuk 1 / 2(X,Y)a<X+Ybx+y=ax+y=b0ϵ1/2ϵ , ditampilkan sebagai persegi panjang abu-abu yang ditutup dengan dua segitiga (kuning dan hijau); dan dari 1 - ϵ ke 1 , muncul sebagai segitiga merah kecil di kanan atas.1/2+ϵ1ϵ1

Apa yang Ditunjukkan Gambar

Dengan membandingkan segitiga kiri bawah pada gambar dengan alun-alun kiri bawah yang mengandungnya dan mengeksploitasi asumsi awal untuk dan Y , jelas bahwaXY

ϵ=Pr(X+Yϵ)<Pr(Xϵ)Pr(Yϵ)=Pr(Xϵ)2.

Perhatikan bahwa ketidaksetaraan itu ketat: kesetaraan tidak mungkin karena ada beberapa kemungkinan positif bahwa dan Y lebih kecil dari ϵ tetapi tetap X + Y > ϵ .XYϵX+Y>ϵ

Demikian pula, membandingkan segitiga merah dengan kuadrat di sudut kanan atas,

ϵ=Pr(X+Y>1ϵ)<Pr(X>1/2ϵ)2.

Akhirnya, membandingkan dua segitiga yang berlawanan di kiri atas dan kanan bawah dengan pita diagonal yang berisi mereka memberikan ketimpangan yang ketat,

2ϵ<2Pr(Xϵ)Pr(X>1/2ϵ)<Pr(1/2ϵ<X+Y1/2+ϵ)=2ϵ.

The terjadi kemudian ketimpangan pertama dari dua sebelumnya (mengambil akar kuadrat dan kalikan mereka) sedangkan yang kedua menggambarkan (ketat) dimasukkannya segitiga dalam band dan kesetaraan terakhir mengungkapkan keseragaman . Kesimpulan bahwa 2 ϵ < 2 ϵ adalah kontradiksi yang membuktikan X dan Y tidak dapat ada, QED .X+Y2ϵ<2ϵXY

whuber
sumber
3
(+1) Saya suka pendekatan ini. Memulihkan bagian belakang amplop saya dari keranjang sampah saya bisa melihat saya menggambar diagram yang sama, kecuali bahwa saya tidak menandai pada segitiga kuning dan hijau di dalam pita. Saya memang mendapatkan ketidaksetaraan untuk segitiga biru dan merah. Saya bermain-main dengan mereka dan beberapa probabilitas lainnya, tetapi tidak pernah berpikir untuk menyelidiki kemungkinan strip, yang ternyata menjadi langkah kritis. Saya bertanya-tanya proses pemikiran apa yang memotivasi wawasan ini?
Silverfish
Bahkan, di mana @whuber memiliki segitiga kuning dan hijau, saya menggambar kotak (saya secara efektif menguraikan menjadi kotak). Melihat langkah yang "menggambarkan (ketat) dimasukkannya segitiga dalam band", 2 Pr ( X ε ) Pr ( X > 1 / 2 - ε ) < Pr ( 1 / 2 - ε < X + Y 1 / 2 + ε )[0,0.5]22Pr(Xϵ)Pr(X>1/2ϵ)<Pr(1/2ϵ<X+Y1/2+ϵ), Saya bertanya-tanya apakah ini sebenarnya akan secara geometris lebih alami dengan kotak membatasi pita daripada segitiga?
Silverfish
1
@Silver Saya teringat analisis jumlah distribusi seragam yang saya pasang beberapa tahun yang lalu. Itu menyarankan memvisualisasikan jumlah geometris. Itu segera jelas bahwa banyak probabilitas harus terkonsentrasi di dekat sudut-sudut ( 0 , 0 ) dan ( 1 / 2 , 1 / 2 ) agar jumlah yang akan seragam dan untuk relatif sedikit probabilitas untuk berada di dekat diagonal pusat X + Y = 1 / 2 . Itu mengarah ke diagram, yang saya ulangi di Mathematica.X+Y(0,0)(1/2,1/2)X+Y=1/2Pada saat itu jawabannya menulis sendiri. Ya, menggunakan kotak di pita tengah mungkin lebih rapi.
whuber
Terima kasih! "Perhatikan bahwa ketidaksetaraan itu ketat: kesetaraan tidak mungkin karena ada beberapa kemungkinan positif bahwa salah satu dari atau Y kurang dari ϵ tetapi tetap X + Y > ϵ ." Saya tidak yakin saya mengikuti ini. Sepertinya saya tujuannya di sini adalah untuk menunjukkan Pr ( X + Y ε ) < Pr ( X ε Y ε ) , tidak ini memerlukan probabilitas yang positif untuk beberapa acara A di mana kedua X danXYϵX+Y>ϵPr(X+Yϵ)<Pr(XϵYϵ)A X kurang dari atau sama dengan ϵ dan belum X + Y > ϵ ? Ini adalah "salah satu dari" vs "keduanya" Saya bimbang. YϵX+Y>ϵ
Silverfish
@Silverfish Terima kasih; Saya tidak mengungkapkan itu seperti yang saya maksudkan. Anda benar: bahasa ini pada dasarnya dimaksudkan untuk menggambarkan bagian persegi kecil yang tidak berada di dalam segitiga.
whuber
10

Saya mencoba menemukan bukti tanpa mempertimbangkan fungsi karakteristik. Kelt kurtosis melakukan trik. Inilah jawaban dua baris: karena X dan Y adalah iid. Kemudian Kurt ( U ) = - 1.2 menyiratkan Kurt ( X ) = - 2.4 yang merupakan kontradiksi dengan Kurt ( X )Kurt(U)=Kurt(X+Y)=Kurt(X)/2XYKurt(U)=1.2Kurt(X)=2.4 untuk variabel acak apa saja.Kurt(X)2

Agak lebih menarik adalah garis penalaran yang membuat saya sampai pada titik itu. (dan Y ) harus dibatasi antara 0 dan 0,5 - yang jelas, tetapi sangat membantu bahwa momen dan momen pusatnya ada. Mari kita mulai dengan mempertimbangkan mean dan varians: E ( U ) = 0,5 dan Var ( U ) = 1XYE(U)=0.5 . JikaXdanYdidistribusikan secara identik, maka kami memiliki:Var(U)=112XY

E(X+Y)=E(X)+E(Y)=2E(X)=0.5

Jadi . Untuk varian kami juga perlu menggunakan independensi untuk menerapkan:E(X)=0.25

Var(X+Y)=Var(X)+Var(Y)=2Var(X)=112

Maka danσX=1Var(X)=124. Wow! Itu banyak variasi untuk variabel acak yang dukungannya berkisar dari 0 hingga 0,5. Tetapi kita harus mengharapkan itu, karena standar deviasi tidak akan skala dengan cara yang sama seperti yang dilakukan oleh mean.σX=1260.204

Sekarang, apa standar deviasi terbesar yang dapat dimiliki oleh variabel acak jika nilai terkecil yang dapat diambil adalah 0, nilai terbesar yang dapat diambil adalah 0,5, dan rata-rata 0,25? Mengumpulkan semua probabilitas pada dua titik massa pada ekstrem, 0,25 dari rata-rata, jelas akan memberikan standar deviasi 0,25. Jadi kita besar tetapi bukan tidak mungkin. (Saya berharap untuk menunjukkan bahwa ini menyiratkan probabilitas terlalu banyak terletak pada ekor untuk X + Y menjadi seragam, tetapi saya tidak bisa mendapatkan apa pun dengan itu di belakang amplop.)σXX+Y

Pertimbangan momen kedua hampir menempatkan kendala yang tidak mungkin pada jadi mari kita pertimbangkan momen yang lebih tinggi. Bagaimana dengan koefisien kemiringan momen Pearson , γ 1 = E ( X - μ X ) 3X ? Ini ada sejak momen sentral ada danσX0. Sangat membantu untuk mengetahui beberapa sifat dari kumulans, khususnya menerapkan independensi dan kemudian memberikan distribusi yang identik:γ1=E(XμX)3σX3=κ3κ23/2σX0

κi(U)=κi(X+Y)=κi(X)+κi(Y)=2κi(X)

Properti aditivitas ini adalah generalisasi dari bagaimana kita berurusan dengan mean dan varians di atas - memang, kumulan pertama dan kedua hanya dan κ 2 = σ 2 .κ1=μκ2=σ2

Then κ3(U)=2κ3(X) and (κ2(U))3/2=(2κ2(X))3/2=23/2(κ2(X))3/2. The fraction for γ1 cancels to yield Skew(U)=Skew(X+Y)=Skew(X)/2X

γ2=κ4κ22=E(XμX)4σX43. By a similar argument (this question is self-study, so try it!), we can show this exists and obeys:

Kurt(U)=Kurt(X+Y)=Kurt(X)/2

The uniform distribution has excess kurtosis 1.2 so we require X to have excess kurtosis 2.4. But the smallest possible excess kurtosis is 2, which is achieved by the Binomial(1,12) Bernoulli distribution.

Silverfish
sumber
2
(+1) This is a quite clever approach, which was new to me. Thanks. Note that some of your analysis could have been streamlined by considering a uniform centered at zero. (The equivalence of the problem is immediate.) That would have immediately told you that considering skew was a dead-end.
cardinal
@cardinal: I knew the skew was a dead-end before I worked on it. The purpose was expository: it's a self-study question so I didn't want to solve it in full! Rather I wanted to leave a hint on how to deal with the next level up...
Silverfish
@cardinal: I was in two minds whether to center or not. I did back-of-envelope calculations more conveniently, but in the final analysis we just need (1) a simple case of the general result that Kurt(X1+...+Xn)=1nKurt(X) for iid Xi, (2) that Kurt(U)=1.2 for any uniform distribution, and (3) Kurt(X) exists since X is bounded and σX0 (which is trivial, else σU=0). So none of the key results actually required centering, though bits may have looked less ugly!
Silverfish
Yes, the word "streamlined" was carefully chosen. :-) I did not intend my comment to be read as criticism of your exposition. Cheers.
cardinal
@cardinal Incidentally, variance considerations alone almost worked, but the uniform isn't quite spread out enough. With a bit more probability mass nearer the extremes, e.g. fT(t)=12t2 on [-0.5, 0.5], then Var(T)=.15 and if T=X1+X2 then σX=.15/20.27>0.25 which is impossible as X is bounded by -0.25 and 0.25. Of course, you will see immediately how this relates to the present example! I wonder if the approach generalises, I'm sure other bounded RVs can't be decomposed into sums but require even higher moments investigated to find the contradiction.
Silverfish