Bagaimana dan mengapa generator angka acak (RNG) penting dalam statistik komputasi?
Saya memahami bahwa keacakan penting ketika memilih sampel untuk banyak uji statistik untuk menghindari bias terhadap hipotesis, tetapi apakah ada area lain dari statistik komputasi di mana generator bilangan acak penting?
Jawaban:
Ada banyak, banyak contoh. Terlalu banyak untuk dicantumkan, dan mungkin terlalu banyak untuk diketahui siapa pun (selain mungkin @whuber, yang seharusnya tidak pernah diremehkan).
Seperti yang Anda sebutkan, dalam percobaan terkontrol kami menghindari bias pengambilan sampel dengan mempartisi subyek secara acak ke dalam kelompok perlakuan dan kontrol.
Dalam bootstraping kami memperkirakan pengambilan sampel berulang dari suatu populasi dengan pengambilan sampel acak dengan penggantian dari sampel tetap. Ini memungkinkan kami memperkirakan varian estimasi kami, antara lain.
Dalam validasi silang, kami memperkirakan kesalahan sampel dari taksiran dengan memecah data secara acak menjadi beberapa irisan dan menyusun pelatihan acak dan set pengujian.
Dalam pengujian permutasi kami menggunakan permutasi acak untuk sampel di bawah hipotesis nol, memungkinkan untuk melakukan tes hipotesis nonparametrik dalam berbagai situasi.
Di mengantongi kami mengontrol varians dari estimasi dengan berulang kali melakukan estimasi pada sampel bootstrap data pelatihan, dan kemudian rata-rata hasil.
Di hutan acak, kami lebih jauh mengontrol varian estimasi dengan juga mengambil sampel secara acak dari prediktor yang tersedia di setiap titik keputusan.
Di simulasi kami meminta model kecocokan untuk secara acak menghasilkan set data baru yang dapat kami bandingkan dengan pelatihan atau pengujian data, membantu memvalidasi kecocokan dan asumsi dalam suatu model.
Di rantai Markov, Monte Carlo, kami mengambil sampel dari distribusi dengan menjelajahi ruang hasil yang mungkin menggunakan rantai Markov (terima kasih kepada @Ben Bolker untuk contoh ini).
Itu hanya aplikasi umum sehari-hari yang langsung terlintas dalam pikiran. Jika saya menggali lebih dalam, saya mungkin bisa menggandakan panjang daftar itu. Keacakan adalah objek studi yang penting, dan alat penting untuk digunakan.
sumber
Jika ini adalah masalah Anda, mungkin judul pertanyaan harus diubah menjadi "Dampak pilihan RNG pada hasil Monte Carlo" atau sesuatu seperti itu. Dalam hal ini, sudah dipertimbangkan pada validasi silang SE , berikut adalah beberapa arahan
sumber