Saya memiliki empat variabel bebas terdistribusi seragam , masing-masing dalam . Saya ingin menghitung distribusi . Saya menghitung distribusi menjadi (maka ), dan dari menjadi Sekarang, distribusi jumlah u_1 + u_2 adalah ( u_1, \, u_2 juga independen) f_ {u_1 + u_2} (x) = \ int _ {- \ infty} ^ {+ \ infty} f_1 (xy) f_2 (y) dy = - \ frac {1} {4} \ int_0 ^ 4 \ frac {1- \ sqrt {xy}} {\ sqrt {xy}} \ cdot \ ln \ frac {y} {4} dy, karena y \ in (0,4]
Saya membuat empat set independen yang terdiri dari nomor masing-masing dan menarik histogram :
dan menggambar plot :
Secara umum, plotnya mirip dengan histogram, tetapi pada interval sebagian besar negatif (root berada di 2,27034). Dan integral dari bagian positif adalah .
Dimana kesalahannya? Atau di mana saya melewatkan sesuatu?
EDIT: Saya memperbesar histogram untuk menampilkan PDF.
EDIT 2: Saya pikir saya tahu di mana masalah dalam alasan saya - dalam batas integrasi. Karena dan , saya tidak bisa hanya . Plot menunjukkan wilayah yang harus saya integrasikan di:x - y ∈ ( 0 , 1 ] ∫ x 0
Ini berarti saya memiliki untuk (itu sebabnya bagian dari saya benar), dalam , dan in . Sayangnya, Mathematica gagal menghitung dua integral terakhir (well, ia menghitung yang kedua, dengan ada unit imajiner dalam output yang merusak segalanya ... ). y ∈ ( 0 , 1 ] f ∫ x x - 1 y ∈ ( 1 , 4 ] ∫ 4 x - 1 y ∈ ( 4 , 5 ]
EDIT 3: Tampaknya Mathematica CAN dapat menghitung tiga integral terakhir dengan kode berikut:
(1/4)*Integrate[((1-Sqrt[u1-u2])*Log[4/u2])/Sqrt[u1-u2],{u2,0,u1},
Assumptions ->0 <= u2 <= u1 && u1 > 0]
(1/4)*Integrate[((1-Sqrt[u1-u2])*Log[4/u2])/Sqrt[u1-u2],{u2,u1-1,u1},
Assumptions -> 1 <= u2 <= 3 && u1 > 0]
(1/4)*Integrate[((1-Sqrt[u1-u2])*Log[4/u2])/Sqrt[u1-u2],{u2,u1-1,4},
Assumptions -> 4 <= u2 <= 4 && u1 > 0]
yang memberikan jawaban yang benar :)
sumber
Jawaban:
Seringkali membantu menggunakan fungsi distribusi kumulatif.
Pertama,
Lanjut,
Biarkan berkisar antara nilai terkecil ( ) dan terbesar ( ) dari . Menulis dengan CDF dan dengan PDF , kita perlu menghitungδ 0 5 (a−d)2+4bc x=(a−d)2 F y=4bc g=G′
Kita bisa berharap ini menjadi jahat - distribusi PDF yang seragam tidak kontinu dan dengan demikian harus menghasilkan jeda dalam definisi - jadi agak menakjubkan bahwa Mathematica mendapatkan formulir tertutup (yang saya tidak akan mereproduksi di sini). Membedakannya sehubungan dengan memberikan kepadatan yang diinginkan. Ini didefinisikan secara berurutan dalam tiga interval. Dalam ,H δ 0<δ<1
Dalam ,1<δ<4
Dan dalam ,4<δ<5
Gambar ini menunjukkan sebidang pada histogram realisasi . Keduanya hampir tidak bisa dibedakan, menunjukkan kebenaran rumus untuk .h 106 (a−d)2+4bc h
Berikut ini adalah solusi Mathematica yang hampir tanpa pemikiran, kasar . Secara otomatis ini mengotomatiskan segala sesuatu tentang perhitungan. Misalnya, ia bahkan akan menghitung rentang variabel yang dihasilkan:
Inilah semua integrasi dan diferensiasi. (Sabar; menghitung butuh beberapa menit.)H
Akhirnya, simulasi dan perbandingan dengan grafik :h
sumber
Seperti OP dan whuber, saya akan menggunakan independensi untuk memecah ini menjadi masalah yang lebih sederhana:
Misalkan . Maka pdf dari , katakanlah adalah:X=(a−d)2 X f(x)
Biarkan . Maka pdf dari , katakanlah adalah:Y=4bc Y g(y)
Masalahnya mengurangi kini menemukan pdf dari . Mungkin ada banyak cara untuk melakukan ini, tetapi yang paling sederhana bagi saya adalah menggunakan fungsi yang disebut dari versi perkembangan saat ini dari mathStatica . Sayangnya, ini tidak tersedia dalam rilis publik pada saat ini, tetapi di sini adalah input:X+Y
TransformSum
yang mengembalikan pdf dari sebagai fungsi piecewise:Z=X+Y
Berikut adalah plot dari pdf yang baru saja diturunkan, katakanlah :h(z)
Periksa cepat Monte Carlo
Diagram berikut membandingkan perkiraan Monte Carlo empiris dari pdf (berlekuk biru) ke pdf teoritis yang diturunkan di atas (putus-putus merah). Terlihat baik.
sumber