Mengapa distribusi rand () ^ 2 berbeda dari rand () * rand ()?

14

Di Libre Office Calc, rand()fungsi tersedia, yang memilih nilai acak antara 0 dan 1 dari distribusi yang seragam. Saya agak berkarat pada probabilitas saya, jadi ketika saya melihat perilaku berikut, saya bingung:

A = 200x1 kolom rand()^2

B = 200x1 kolom rand()*rand()

mean(A) = 1/3

mean(B) = 1/4

Kenapa mean(A)! = 1/4?

Jefftopia
sumber
4
Karena harapan kuadrat dari variabel acak tidak sama dengan kuadrat dari harapannya.
Michael M
3
Jika rand()beroperasi seperti operator serupa lainnya maka A adalah angka acak yang sama kuadrat dan B adalah dua angka acak, dikalikan.
Peter Flom - Reinstate Monica
Saya mengerti. Akan sangat membantu jika saya bisa melihat matematika dieja, atau terkait dengan sumber daya yang melakukan ini.
Jefftopia
4
Menyederhanakan situasi mungkin membantu Anda memahami intinya. Misalkan Rand()diganti oleh Int(2*Rand()): ini mengambil nilai dan 1 dengan probabilitas yang sama. Ada dua kemungkinan untuk kuadratnya dan empat kemungkinan untuk produk dari dua nilai (independen): apa yang terjadi ketika Anda memenuhi harapan mereka? 01
whuber

Jawaban:

24

Mungkin bermanfaat untuk memikirkan persegi panjang. Bayangkan Anda memiliki kesempatan untuk mendapatkan tanah secara gratis. Ukuran tanah akan ditentukan oleh (a) satu realisasi dari variabel acak atau (b) dua realisasi dari variabel acak yang sama. Dalam kasus pertama (a), area akan menjadi kuadrat dengan panjang sisi sama dengan nilai sampel. Dalam kasus kedua (b), dua nilai sampel akan mewakili lebar dan panjang persegi panjang. Alternatif mana yang Anda pilih?

Biarkan menjadi realisasi dari variabel acak positif.U

a) Nilai yang diharapkan dari satu realisasi menentukan luas persegi yang sama dengan U 2 . Rata-rata, ukuran area adalah E [ U 2 ]UU2

E[U2]

b) Jika ada dua realisasi independen dan U 2 , area tersebut akan menjadi U 1U 2 . Rata-rata, ukurannya sama dengan E [ U 1U 2 ] = E 2 [ U ] karena kedua realisasi berasal dari distribusi yang sama dan independen.U1U2U1U2

E[U1U2]=E2[U]

Ketika kami menghitung perbedaan antara ukuran area a) dan b), kami memperoleh

E[U2]-E2[U]

Istilah di atas identik dengan VSebuahr[U] yang secara inheren lebih besar atau sama dengan .0

Ini berlaku untuk kasus umum.

Dalam contoh Anda, Anda sampel dari distribusi seragam . Karenanya,U(0,1)

E2[U]=1

E[U]=12
Var[U]=1
E2[U]=14
VSebuahr[U]=112

Dengan kita memperoleh E [ U 2 ] =E[U2]=VSebuahr[U]+E2[U]

E[U2]=112+14=13

Nilai-nilai ini diturunkan secara analitis tetapi mereka cocok dengan yang Anda peroleh dengan generator angka acak.

Sven Hohenstein
sumber
SebuahbSebuah2+Sebuahb+b23
Itu adalah penggunaan varian yang cerdas. Dan di sini saya akan melakukan perhitungan langsung.
Affine
Ini masuk akal bagi saya. Semuanya bergantung pada varian menjadi non-negatif. Saya juga ingin tahu bagaimana John mendapatkan jawabannya.
Jefftopia
Pada dasarnya hanya mengikuti apa yang dilakukan Sven, tetapi menggantinya dengan formula untuk distribusi seragam yang lebih umum.
John
E[U2]-E[U2]E[U2]-E2[U]
9

Bukan untuk menyarankan bahwa ada sesuatu yang kurang dari jawaban Sven yang luar biasa, tetapi saya ingin menyajikan pandangan yang relatif mendasar tentang pertanyaan itu.

Pertimbangkan untuk memplot dua komponen dari setiap produk untuk melihat bahwa distribusi sambungannya sangat berbeda.

plot u1 vs u2 dan u1 vs u1

Perhatikan bahwa produk cenderung hanya besar (mendekati 1) ketika kedua komponen besar, yang terjadi jauh lebih mudah ketika dua komponen berkorelasi sempurna daripada independen.

1-ϵϵϵ/2U2U1×U2ϵ2/2

Cukup berbeda!

Mungkin membantu menggambar kontur produk-iso pada grafik seperti di atas - yaitu, kurva di mana xy = konstan untuk nilai-nilai seperti 0,5, 0,6, 0,7, 0,8, 0,9. Ketika Anda pergi ke nilai yang lebih besar dan lebih besar, proporsi poin di atas dan di sebelah kanan kontur turun jauh lebih cepat untuk kasus independen.

Glen_b -Reinstate Monica
sumber