Saya mencoba belajar penguatan dan topik ini benar-benar membingungkan saya. Saya telah mengambil pengantar statistik, tetapi saya tidak bisa memahami topik ini secara intuitif.
sumber
Saya mencoba belajar penguatan dan topik ini benar-benar membingungkan saya. Saya telah mengambil pengantar statistik, tetapi saya tidak bisa memahami topik ini secara intuitif.
Pengambilan sampel kepentingan adalah suatu bentuk pengambilan sampel dari distribusi yang berbeda dari distribusi bunga sehingga untuk lebih mudah mendapatkan estimasi parameter yang lebih baik dari distribusi bunga. Biasanya ini akan memberikan perkiraan parameter dengan varians yang lebih rendah daripada yang akan diperoleh dengan mengambil sampel langsung dari distribusi asli dengan ukuran sampel yang sama.
Ini diterapkan dalam berbagai konteks. Secara umum, pengambilan sampel dari distribusi yang berbeda memungkinkan lebih banyak sampel untuk diambil dalam porsi distribusi bunga yang ditentukan oleh aplikasi (wilayah penting).
Salah satu contoh mungkin adalah Anda ingin memiliki sampel yang mencakup lebih banyak sampel dari ekor distribusi daripada sampel acak murni dari distribusi bunga akan memberikan.
The artikel wikipedia yang saya lihat tentang hal ini terlalu abstrak. Lebih baik untuk melihat berbagai contoh spesifik. Namun itu termasuk tautan ke aplikasi menarik seperti Bayesian Networks.
Salah satu contoh pengambilan sampel yang penting pada tahun 1940-an dan 1950-an adalah teknik reduksi varians (suatu bentuk Metode Monte Carlo). Lihat misalnya buku Metode Monte Carlo oleh Hammersley dan Handscomb yang diterbitkan sebagai Methuen Monograph / Chapman and Hall pada tahun 1964 dan dicetak ulang pada tahun 1966 dan kemudian oleh penerbit lain. Bagian 5.4 buku ini mencakup Pengambilan Sampel Penting.
Importance sampling adalah metode simulasi atau Monte Carlo yang ditujukan untuk perkiraan integral. Istilah "pengambilan sampel" agak membingungkan karena tidak bermaksud memberikan sampel dari distribusi yang diberikan.
Intuisi di balik sampel penting adalah bahwa integral yang didefinisikan dengan baik, seperti dapat dinyatakan sebagai harapan untuk berbagai distribusi probabilitas: Saya = E f [ H ( X ) ] = ∫ X H ( x ) f ( x )
Setelah properti elementer ini dipahami, implementasi idenya adalah untuk bergantung pada Hukum Angka Besar seperti dalam metode Monte Carlo lainnya, yaitu, untuk mensimulasikan [melalui generator pseudo-acak] sampel iid didistribusikan dari f dan menggunakan pendekatan I = 1(x1,…,xn) f yang
Tergantung pada pilihan distribusi , estimator atas saya mungkin atau mungkin tidak memiliki varians yang terbatas. Namun, selalu ada pilihan f yang memungkinkan untuk varian terbatas dan bahkan untuk varian kecil sewenang-wenang (meskipun pilihan itu mungkin tidak tersedia dalam praktik). Dan ada juga ada pilihan f yang membuat sampling pentingnya estimator saya pendekatan yang sangat miskin dari saya . Ini termasuk semua pilihan di mana varians menjadi tak terbatas, meskipun makalah baru-baru ini oleh Chatterjee dan Diaconis mempelajari bagaimana membandingkan sampler yang penting dengan varians yang tak terbatas. Gambar di bawah ini diambil darif I^ f f I^ I saya diskusi blog dari kertas dan menggambarkan konvergensi miskin estimator varians yang tak terbatas.
[Berikut ini direproduksi dari buku kami Metode Statistik Monte Carlo .]
sumber