Katakanlah saya sedang mencoba mencari kemungkinan bahwa rasa es krim favorit seseorang adalah vanila.
Saya tahu orang itu juga menikmati film horor.
Saya ingin mengetahui kemungkinan bahwa es krim favorit orang itu adalah vanila mengingat mereka menikmati film horor.
Saya tahu hal-hal berikut:
- orang memilih vanila sebagai rasa es krim favorit mereka. (Ini saya )
- orang yang kesukaannya adalah es krim vanilla juga suka film horor. (Ini adalah saya )
- orang yang kesukaannya bukan es krim vanila juga suka film horor (Ini milik saya )
Jadi, saya menghitungnya seperti ini: Saya menemukan bahwa (dibulatkan ke sepuluh-ribu terdekat). Ada kemungkinan kemungkinan rasa es krim favorit penggemar film horor adalah vanilla. P(A|B)=0,344834,48%
Tetapi kemudian saya mengetahui bahwa orang tersebut telah menonton film horor dalam 30 hari terakhir. Inilah yang saya tahu:
- adalah probabilitas posterior yang diperbarui bahwa vanila adalah rasa es krim favorit seseorang - dalam masalah berikutnya.
- orang yang kesukaannya adalah es krim vanilla telah menonton film horor dalam 30 hari terakhir.
- orang yang kesukaannya bukan es krim vanilla telah menonton film horor dalam 30 hari terakhir.
Ini memberi: ketika dibulatkan.
Jadi sekarang saya percaya ada kesempatan bahwa penggemar film horor suka es krim mengingat bahwa mereka telah melihat film horor dalam 30 hari terakhir.
Tapi tunggu, ada satu hal lagi. Saya juga mengetahui bahwa orang tersebut memiliki kucing.
Inilah yang saya tahu:
- P ( A ) adalah probabilitas posterior yang diperbarui bahwa vanila adalah rasa es krim favorit seseorang - dalam masalah berikutnya
- orang yang kesukaannya adalah es krim vanila juga memiliki kucing
- orang yang kesukaannya bukan es krim vanila juga memiliki kucing
Ini menghasilkan: ketika dibulatkan.
Pertanyaan saya pada dasarnya bermuara pada ini: Apakah saya benar memperbarui probabilitas menggunakan teorema Bayes? Apakah ada yang salah dengan metode saya?
sumber
Jawaban:
Ini tidak benar. Pembaruan berurutan dari jenis ini hanya berfungsi ketika informasi yang Anda terima secara berurutan independen (mis. Pengamatan awal dari variabel acak). Jika setiap pengamatan tidak independen, seperti dalam kasus ini, Anda perlu mempertimbangkan distribusi probabilitas gabungan. Cara yang benar untuk memperbarui adalah kembali ke sebelumnya, menemukan probabilitas bersama bahwa seseorang menyukai film-film horor, telah menonton film horor dalam 30 hari terakhir, dan memiliki seekor kucing mengingat mereka memilih atau tidak memilih vanila sebagai milik mereka. rasa es krim favorit, dan kemudian perbarui dalam satu langkah.
Memperbarui secara berurutan seperti ini ketika data Anda tidak independen akan dengan cepat mendorong probabilitas posterior Anda jauh lebih tinggi atau lebih rendah dari yang seharusnya.
sumber