Misalkan variabel acak memiliki batas bawah dan atas [0,1]. Bagaimana cara menghitung varians dari variabel seperti itu?
22
Misalkan variabel acak memiliki batas bawah dan atas [0,1]. Bagaimana cara menghitung varians dari variabel seperti itu?
Jawaban:
Anda dapat membuktikan ketidaksetaraan Popoviciu sebagai berikut. Gunakan notasi dan . Tentukan fungsi oleh Menghitung turunan , dan menyelesaikan kami menemukan bahwa mencapai minimum pada ( perhatikan bahwa ).m = inf X M.= sup X g g( t ) = E [ ( X- t )2]. g′ g′(t)=−2E[X]+2t=0, g t=E[X] g′′>0
Sekarang, pertimbangkan nilai fungsi pada titik khusus . Itu harus menjadi kasus yang Tetapi Karena dan , kami memiliki menyiratkan bahwag t = M+ m2 V a r [X] = g( E [ X] ) ≤ g(M+m2). g(M+m2)=E[(X−M+m2)2]=14E[((X−m)+(X−M))2]. X−m≥0 X−M≤0 ((X−m)+(X−M))2≤((X−m)−(X−M))2=(M−m)2, 14E [ ( ( X- m ) + ( X- M.) )2] ≤ 14E [ ( ( X−m)−(X−M))2]=(M−m)24. V a
Karenanya, kami membuktikan ketidaksetaraan
Var[X]≤(M−m)24.
sumber
Biarkan menjadi distribusi pada . Kami akan menunjukkan bahwa jika varians dari maksimal, maka dapat memiliki tidak ada dukungan di pedalaman, dari yang berikut bahwa adalah Bernoulli dan sisanya adalah sepele.[ 0 , 1 ] F F FF [ 0 , 1 ] F F F
Sebagai soal notasi, biarkan menjadi th saat baku dari (dan, seperti biasa, kita menulis dan untuk varians).k F μ = μ 1 σ 2 = μ 2 - μ 2μk= ∫10xkdF( x ) k F μ=μ1 σ2= μ2- μ2
Kita tahu tidak memiliki semua dukungannya pada satu titik (variansnya minimal dalam hal itu). Antara lain, ini menyiratkan benar-benar terletak antara dan . Untuk berdebat dengan kontradiksi, anggaplah ada beberapa himpunan bagian dapat diukur di bagian dalam yang . Tanpa kehilangan sifat umum kita dapat mengasumsikan (dengan mengubah ke jika perlu) bahwa : dengan kata lain, diperoleh dengan memotong semua bagian dari atas mean danμ 0 1 I ( 0 , 1 ) F ( I ) > 0 X 1 - X F ( J = I ∩ ( 0 , μ ] ) > 0 J I JF μ 0 1 saya ( 0 , 1 ) F( Saya) > 0 X 1 - X F( J= Saya∩(0,μ])>0 J I J memiliki probabilitas positif.
Mari kita ubah ke dengan mengambil semua probabilitas dari dan menempatkannya pada . F ′F F′ 0 J 0 μ k Dengan demikian, berubah menjadiμk
Sebagai notasi, marilah kita menulis untuk integral tersebut, dari mana[g(x)]=∫Jg(x)dF(x)
Menghitung
Istilah kedua di sebelah kanan, , adalah non-negatif karena mana-mana di . Istilah pertama di sebelah kanan dapat ditulis ulangμ ≥ x J(μ[x]−[x]2) μ≥x J
Istilah pertama di sebelah kanan adalah benar - benar positif karena (a) dan (b) karena kita mengasumsikan tidak terkonsentrasi pada suatu titik. Istilah kedua adalah non-negatif karena dapat ditulis ulang sebagai dan integand ini tidak negatif dari asumsi pada dan . Oleh karena itu .[ 1 ] = F ( J ) < 1 F [ ( μ - x ) ( x ) ] μ ≥ x J 0 ≤ x ≤ 1μ>0 [1]=F(J)<1 F [(μ−x)(x)] μ≥x J 0≤x≤1 σ′2−σ2>0
Kami baru saja menunjukkan bahwa berdasarkan asumsi kami, mengubah ke secara ketat meningkatkan variansnya. Maka satu-satunya cara ini tidak dapat terjadi adalah ketika semua probabilitas terkonsentrasi pada titik akhir dan , dengan (katakanlah) masing-masing nilai dan . Variansnya mudah dihitung hingga sama dengan yang maksimal ketika dan sama dengan sana.F ′ F ′ 0 1 1 - p p p ( 1 - p ) p =F F′ F′ 0 1 1−p p p ( 1 -p) p = 1 / 2 1 / 4
Sekarang ketika adalah distribusi pada , kami memasukkan kembali dan mengubah skala ke distribusi pada . Recentering tidak mengubah varians sedangkan rescaling membaginya dengan . Jadi dengan varians maksimal pada sesuai dengan distribusi dengan varians maksimal pada : karena itu adalah distribusi Bernoulli diubah dan diterjemahkan ke memiliki varian 2/4 , QED .[ a , b ] [ 0 , 1 ] ( b - a ) 2 F [ a , b ] [ 0 , 1 ] ( 1 / 2 ) [ a , b ] ( b - a ) 2 / 4F [ a , b ] [ 0 , 1 ] ( b - a )2 F [ a , b ] [ 0 , 1 ] ( 1 / 2 ) [ a , b ] ( b - a )2/ 4
sumber
Jika variabel acak dibatasi untuk dan kita tahu rata-rata , varians dibatasi oleh .μ = E [ X ] ( b - μ ) ( μ - a )[a,b] μ=E[X] (b−μ)(μ−a)
Mari kita perhatikan kasus . Perhatikan bahwa untuk semua , , karenanya juga . Dengan menggunakan hasil ini, x ∈ [ 0 , 1 ] x 2 ≤ x E [ X 2 ] ≤ E [ X ] σ 2 = E [ X 2 ] - ( E [ X ] 2 ) = E [ X 2 ] - μ 2 ≤ μ - μ 2 = μ (a=0,b=1 x∈[0,1] x2≤x E[X2]≤E[X]
Untuk menggeneralisasi ke interval dengan , pertimbangkan terbatas pada . Tentukan , yang dibatasi dalam . Secara ekivalen, , dan dengan demikian mana ketidaksetaraan didasarkan pada hasil pertama. Sekarang, dengan mengganti , sama dengan yang merupakan hasil yang diinginkan.b > a Y [ a , b ] X = Y - a[a,b] b>a Y [a,b] [0,1]Y=(b-a)X+aVar[Y]=(b-a)2Var[X]≤(b-a)2μX(1-μX). μX=μY-aX=Y−ab−a [0,1] Y=(b−a)X+a
sumber
Atas permintaan @ user603 ....
Batas atas yang berguna pada varians dari variabel acak yang mengambil nilai dalam dengan probabilitas adalah . Bukti untuk kasus khusus (yang ditanyakan OP) dapat ditemukan di sini di math.SE , dan mudah disesuaikan dengan kasus yang lebih umum. Seperti disebutkan dalam komentar saya di atas dan juga dalam jawaban yang dirujuk di sini, variabel acak diskrit yang mengambil nilai dan dengan probabilitas yang sama memiliki varians dan dengan demikian tidak ada batasan umum yang lebih ketat dapat ditemukan.σ2 [ a , b ] 1 σ2≤ ( b - a )24 a = 0 , b = 1 Sebuah b 12 ( b - a )24
Hal lain yang perlu diingat adalah bahwa variabel acak terikat memiliki varians terbatas, sedangkan untuk variabel acak tak terikat, varians mungkin tidak terbatas, dan dalam beberapa kasus bahkan mungkin tidak dapat didefinisikan. Sebagai contoh, rata-rata tidak dapat didefinisikan untuk variabel acak Cauchy , dan karenanya seseorang tidak dapat mendefinisikan varians (seperti harapan deviasi kuadrat dari rata-rata).
sumber
apakah Anda yakin bahwa ini berlaku secara umum - untuk distribusi yang berkelanjutan dan terpisah? Bisakah Anda memberikan tautan ke halaman lain? Untuk distribusi umum pada sepele untuk menunjukkan bahwa Saya dapat membayangkan bahwa ada ketimpangan yang lebih tajam ... Apakah Anda membutuhkan faktor untuk hasil Anda?V a r ( X ) = E [ ( X - E [ X ] ) 2 ] ≤ E [ ( b - a ) 2 ] = ( b - a ) 2 . 1 / 4[ a , b ]
Di sisi lain kita dapat menemukannya dengan faktor bawah nama Popoviciu's_inequality di wikipedia.1 / 4
Artikel ini terlihat lebih baik daripada artikel wikipedia ...
Untuk distribusi yang seragam itu menyatakan bahwa
sumber