Keuntungan dari banyak simulasi di Monte Carlo kuno?

8

Semangat pertanyaan ini berasal dari "Monte Carlo Biasa", yang juga dikenal sebagai "Monte Carlo kuno yang baik"

Misalkan saya punya variabel acak X, dengan

μ: =E[X]σ2: =VSebuahr[X]

Keduanya adalah nilai yang tidak diketahui, karena fungsi distribusi probabilitas X tidak diketahui (atau komputasinya sulit dilakukan).

Either way, misalkan kita dapat mensimulasikan entah bagaimana n menarik X1,X2,...,Xn (ini independen dan terdistribusi secara identik) dari distribusi X. Mari kita tentukan parameter sampel

μ^n: =1nsaya=1nXsayaσ^n2: =1nsaya=1n(Xsaya-μ^n)2

Menurut Teorema Limit Pusat, sebagai n menjadi sangat besar, rata-rata sampel μ^n akan sangat mematuhi distribusi normal

μ^N(μ,σ2n)

Sebelum kita dapat menghitung interval kepercayaan, penulis menyatakan bahwa karena kita tidak tahu σ2, kami akan membuat estimasi itu σ2σ^2, atau lebih tepatnya untuk estimasi yang tidak bias σ2nn-1σ^2, dan kita dapat melanjutkan dari sana menggunakan teknik standar.

Sekarang, sementara penulis menyebutkan pentingnya ncukup besar ( jumlah undian per simulasi), tidak disebutkan tentang jumlah simulasi dan pengaruhnya terhadap kepercayaan kami.

Apakah ada keuntungan dari berlari k simulasi (melakukan n menarik setiap kali) untuk mendapatkan beberapa cara sampel μ^n,1,μ^n,2,...μ^n,k, dan kemudian gunakan sarana sarana untuk meningkatkan taksiran dan keyakinan kami tentang hal yang tidak diketahui μ,σ dari X?

Atau apakah cukup dengan menggambar saja n sampel dari X dalam simulasi tunggal, selama n cukup besar

jII
sumber

Jawaban:

5

Selama masalah tentang pembuatan angka pseudo-acak dihindari (lihat catatan di bagian akhir), kedua pendekatan tersebut (k simulasi dengan n menggambar vs simulasi tunggal dengan cukup besar n) adalah setara sehubungan dengan memperkirakan rata-rata . Mengenai ingatan, amati itu, dalamk kasus simulasi, Anda perlu menyimpan berarti sampel μ^n,1,...,μ^n,ksebelum melakukan rerata final, sementara ini tidak terjadi dalam skenario simulasi tunggal. Dengan komputer modern, melakukan simulasi tunggal dengan cukup besarn seharusnya tidak lebih sulit dari apa yang dijelaskan sebelumnya dan, pada kenyataannya, harus menghemat waktu.

Alasan matematika di luar kesetaraan adalah linearitas. Untuk lebih tepatnya, dik skenario simulasi, Anda menghitung mean sampel "final" μ^ sebagai berikut

μ^=1kh=1kμ^n,h=1kh=1k1nsaya=1nXsaya(h)=1nkh=1ksaya=1nXsaya(h)
dimana Xsaya(h) menunjukkan undian bernomor saya di simulasi h. Penahbisan ini arbitrer jika tidak ada yang aneh terjadi, sehingga Anda dapat memberi label ulang masing-masingXsaya(h) dengan indeks baru, katakanlah m=1,...,nk, memperoleh
μ^=1nkm=1nkXm
Tapi ini setara dengan melakukan simulasi tunggal dengan nk draw (jelas, draw harus iid, seperti yang sudah disebutkan).

Catatan: Potensi masalah dengan PRNG dijelaskan di halaman Wikipedia .

PseudoRandom
sumber
1
Jawaban bagus! Saya telah membuat realisasi ini sedikit setelah memposting. Dan karena varians dari sampel kami berbanding terbalikn(jumlah sampel), kepercayaan kami juga meningkat (setidaknya, secara teoritis).
JII