Misalkan sebuah game menawarkan acara yang setelah selesai, baik memberikan hadiah, atau tidak memberikan apa pun. Mekanisme yang tepat untuk menentukan apakah hadiah diberikan tidak diketahui, tetapi saya berasumsi generator nomor acak digunakan, dan jika hasilnya lebih besar dari nilai hard-coded, Anda mendapatkan hadiahnya.
Jika pada dasarnya saya ingin merekayasa balik nilai apa yang digunakan programmer untuk menentukan seberapa sering hadiah diberikan (diperkirakan 15-30%), bagaimana cara menghitung jumlah sampel yang saya butuhkan?
Saya mulai dengan bagian "Estimator probabilitas sejati" di sini: Memeriksa_kapal_a_main_a_kartu , tapi saya tidak yakin saya menuju jalan yang benar. Saya mendapatkan hasil ~ 1000 sampel yang dibutuhkan untuk kesalahan maksimum 3% pada kepercayaan 95%.
Pada akhirnya, inilah yang saya coba pecahkan:
- Acara # 1 memberikan hadiah 1.0R, X% dari waktu
- Acara # 2 memberikan hadiah 1,4R, Y% dari waktu
Saya ingin memperkirakan X & Y cukup akurat untuk menentukan acara mana yang lebih efisien. Ukuran sampel besar adalah masalah karena saya hanya bisa mendapatkan 1 sampel setiap 20 menit, paling banyak.
Jawaban:
sumber
Saya tahu itu kurang elegan, tetapi saya harus mensimulasikannya. Saya tidak hanya membuat simulasi yang cukup sederhana, tetapi juga tidak bagus dan lambat untuk dijalankan. Cukup bagus. Satu keuntungan adalah bahwa, selama beberapa dasar-dasarnya benar, itu akan memberi tahu saya ketika pendekatan elegan jatuh.
Ukuran sampel akan bervariasi sebagai fungsi dari nilai hard-coded.
Jadi inilah kodenya:
Jauh dari 50%, "pengamatan agak kurang" tampaknya diperlukan, seperti yang disarankan kjetil.
Saya pikir Anda bisa mendapatkan perkiraan prevalensi yang layak sebelum 400 sampel, dan sesuaikan strategi pengambilan sampel Anda. Saya tidak berpikir harus ada joging di tengah, dan jadi Anda mungkin menabrak N_loops hingga 10e3, dan menabrak "oleh" di "my_prev" ke 0,001.
sumber
sumber