Saya membaca artikel Galat propagasi oleh metode Monte Carlo dalam perhitungan geokimia, Anderson (1976) dan ada sesuatu yang tidak saya mengerti.
Pertimbangkan beberapa data terukur dan program yang memprosesnya dan mengembalikan nilai yang diberikan. Dalam artikel ini, program ini digunakan untuk pertama-tama mendapatkan nilai terbaik menggunakan sarana data (yaitu: { A , B , C } ).
Penulis kemudian menggunakan metode Monte Carlo untuk menetapkan ketidakpastian pada nilai terbaik ini, dengan memvariasikan parameter input dalam batas ketidakpastiannya (diberikan oleh distribusi Gaussian dengan cara dan standar deviasi { σ A , σ B , σ C } ) sebelum memberi mereka makan ke program. Ini diilustrasikan pada gambar di bawah ini:
( Hak Cipta: ScienceDirect )
di mana ketidakpastian dapat diperoleh dari distribusi akhir .
Apa yang akan terjadi jika, alih-alih metode Monte Carlo ini, saya menerapkan metode bootstrap? Sesuatu seperti ini:
Ini adalah: alih-alih memvariasikan data dalam ketidakpastian mereka sebelum memasukkannya ke program, saya sampel dengan penggantian dari mereka.
Apa perbedaan antara kedua metode ini dalam kasus ini? Peringatan apa yang harus saya ketahui sebelum menerapkannya?
Saya mengetahui pertanyaan ini Bootstrap, Monte Carlo , tetapi tidak cukup menyelesaikan keraguan saya karena, dalam hal ini, data berisi ketidakpastian yang ditetapkan.
sumber
Jawaban:
Sejauh yang saya mengerti pertanyaan Anda, perbedaan antara pendekatan "Monte Carlo" dan pendekatan bootstrap pada dasarnya adalah perbedaan antara statistik parametrik dan non-parametrik.
sumber
Perubahan Acak dalam Model Monte Carlo Anda diwakili oleh kurva lonceng dan perhitungannya mungkin mengasumsikan "kesalahan" atau "Perubahan" yang didistribusikan secara normal. Paling tidak, komputer Anda memerlukan beberapa asumsi tentang distribusi untuk menggambar "perubahan". Bootstrapping tidak harus membuat asumsi seperti itu. Dibutuhkan pengamatan sebagai pengamatan dan jika kesalahan mereka terdistribusi secara asimetris, maka ia masuk ke dalam model seperti itu.
Bootstrap menarik dari pengamatan dan karenanya membutuhkan sejumlah pengamatan yang benar. Jika Anda membaca dalam sebuah buku, rata-rata C pada 5 dengan standar deviasi 1, maka Anda dapat mengatur Monte Carlo Modell bahkan jika Anda tidak memiliki pengamatan untuk menggambar. Jika pengamatan Anda langka (pikirkan: astronomi), Anda dapat mengatur Monte Carlo Modell dengan 6 pengamatan dan beberapa asumsi tentang distribusinya tetapi Anda tidak akan melakukan bootstrap dari 6 pengamatan.
Model campuran dengan beberapa input yang diambil dari data yang diamati dan beberapa dari data yang disimulasikan (katakanlah hipotetis) adalah mungkin.
Sunting: Dalam diskusi berikut dalam komentar, poster asli menemukan bantuan berikut:
sumber
Jika fungsi yang menghubungkan output Z ke input cukup linier (yaitu dalam rentang variasi input), varian Z adalah kombinasi varian dan kovarian input. Detail distribusi tidak terlalu menjadi masalah ... Jadi, kedua metode harus mengembalikan hasil yang sama.
Lihat Suplemen 1 ke GUM
sumber
Bootstrap berarti membiarkan data berbicara sendiri. Dengan metode Monte Carlo, Anda mencicipi banyak undian acak dari CDF yang dikenakan (normal; gamma; beta ...) melalui distribusi seragam dan membuat PDF empiris (asalkan CDF kontinu dan dapat diturunkan). Penjelasan yang menarik dari keseluruhan proses Monte Carlo dilaporkan dalam: Briggs A, Schulper M, pemodelan keputusan Claxton K. untuk evaluasi ekonomi kesehatan. Oxford: Oxford University Press, 2006: 93-95.
sumber