Apakah ini cara yang benar untuk terus memperbarui probabilitas menggunakan Bayes Theorem?

Katakanlah saya sedang mencoba mencari kemungkinan bahwa rasa es krim favorit seseorang adalah vanila.

Saya tahu orang itu juga menikmati film horor.

Saya ingin mengetahui kemungkinan bahwa es krim favorit orang itu adalah vanila mengingat mereka menikmati film horor.

Saya tahu hal-hal berikut:

$5\%$ orang memilih vanila sebagai rasa es krim favorit mereka. (Ini saya ) $P(A)$
$10\%$ orang yang kesukaannya adalah es krim vanilla juga suka film horor. (Ini adalah saya ) $P(B|A)$
$1\%$ orang yang kesukaannya bukan es krim vanila juga suka film horor (Ini milik saya ) $P(B|\lnot A)$

Jadi, saya menghitungnya seperti ini: Saya menemukan bahwa (dibulatkan ke sepuluh-ribu terdekat). Ada kemungkinan kemungkinan rasa es krim favorit penggemar film horor adalah vanilla.

P (SEBUAH | B) = \frac{0,05 \times 0,1}{(0,05 \times 0,1) + (0,01 \times (1 - 0,05))}

$P(A|B)=\frac{0.05\times0.1}{(0.05 \times 0.1)+(0.01 \times(1-0.05))}$

P (A | B) = 0.3448

$P(A|B) = 0.3448$

34.48 %

$34.48\%$

Tetapi kemudian saya mengetahui bahwa orang tersebut telah menonton film horor dalam 30 hari terakhir. Inilah yang saya tahu:

$34.48\%$ adalah probabilitas posterior yang diperbarui bahwa vanila adalah rasa es krim favorit seseorang - dalam masalah berikutnya. $P(A)$
$20\%$ orang yang kesukaannya adalah es krim vanilla telah menonton film horor dalam 30 hari terakhir.
$5\%$ orang yang kesukaannya bukan es krim vanilla telah menonton film horor dalam 30 hari terakhir.

Ini memberi: ketika dibulatkan.

\frac{0,3448 \times 0,2}{(0,3448 \times 0,2) + (0,05 \times (1 - 0,3448))} = 0,6779

$\frac{0.3448\times0.2}{(0.3448\times0.2)+(0.05\times(1-0.3448))} = 0.6779$

Jadi sekarang saya percaya ada kesempatan bahwa penggemar film horor suka es krim mengingat bahwa mereka telah melihat film horor dalam 30 hari terakhir. $67.79\%$

Tapi tunggu, ada satu hal lagi. Saya juga mengetahui bahwa orang tersebut memiliki kucing.

Inilah yang saya tahu:

$67.79\%$ adalah probabilitas posterior yang diperbarui bahwa vanila adalah rasa es krim favorit seseorang - dalam masalah berikutnya $P(A)$
$40\%$ orang yang kesukaannya adalah es krim vanila juga memiliki kucing
$10\%$ orang yang kesukaannya bukan es krim vanila juga memiliki kucing

Ini menghasilkan: ketika dibulatkan.

\frac{0,6779 \times 0,4}{(0,6779 \times 0,4) + (0,1 \times (1 - 0,6779))} = 0,8938

$\frac{0.6779\times0.4}{(0.6779\times 0.4)+(0.1\times(1-0.6779))} = 0.8938$

Pertanyaan saya pada dasarnya bermuara pada ini: Apakah saya benar memperbarui probabilitas menggunakan teorema Bayes? Apakah ada yang salah dengan metode saya?

probability bayes pengguna1626730
sumber

cinta = favorit? Anda tidak memposting derajat cinta. jika Anda menyukainya, itu adalah favorit Anda. mengklarifikasi jika diperlukan.

generic_user

Poin yang bagus. Saya mengubah "cinta" menjadi "favorit." Ini tidak benar secara tata bahasa, tetapi kurang bertele-tele daripada mengatakan "pilih vanilla untuk rasa es krim favorit mereka." Saya harap itu beres.

user1626730

Jawaban:

Ini tidak benar. Pembaruan berurutan dari jenis ini hanya berfungsi ketika informasi yang Anda terima secara berurutan independen (mis. Pengamatan awal dari variabel acak). Jika setiap pengamatan tidak independen, seperti dalam kasus ini, Anda perlu mempertimbangkan distribusi probabilitas gabungan. Cara yang benar untuk memperbarui adalah kembali ke sebelumnya, menemukan probabilitas bersama bahwa seseorang menyukai film-film horor, telah menonton film horor dalam 30 hari terakhir, dan memiliki seekor kucing mengingat mereka memilih atau tidak memilih vanila sebagai milik mereka. rasa es krim favorit, dan kemudian perbarui dalam satu langkah.

Memperbarui secara berurutan seperti ini ketika data Anda tidak independen akan dengan cepat mendorong probabilitas posterior Anda jauh lebih tinggi atau lebih rendah dari yang seharusnya.

Jonathan Christensen
sumber

Bagaimana yang Anda maksud dengan "ketika informasi yang Anda terima berurutan independen?" Jika maksud Anda "tidak tergantung pada acara yang ingin Anda prediksi," apakah Anda tahu bagaimana saya dapat mengetahui apakah info yang saya peroleh independen?

user1626730

Independen bersyarat mengingat acara yang Anda coba prediksi. Jika mereka independen dari acara yang Anda coba prediksi maka mereka tidak akan membantu Anda. Adapun cara Anda tahu - Anda harus berpikir tentang apa data Anda. Dalam hal ini, apakah seseorang telah menonton film horor dalam 30 hari terakhir jelas tidak terlepas dari apakah mereka menyukai film horor.

Jonathan Christensen

Ketika Anda mengatakan "independen secara kondisional," saya kira maksud Anda setiap P (B) (yaitu, pecinta film horor, kepemilikan kucing) tidak saling berhubungan? Jika demikian, bukankah variabel kepemilikan kucing tidak tergantung pada pencinta film horor?

user1626730

Ya, Anda dapat berargumen bahwa kepemilikan kucing tidak tergantung pada pecinta film horor. Namun, itu tidak berarti - misalnya, mungkin wanita lebih cenderung mencintai kucing dan lebih sedikit menyukai film horor.

Jonathan Christensen

Hm, saya tidak begitu yakin apa yang Anda maksud dengan menambahkan sedikit tentang wanita dan kucing. Bisakah Anda menjelaskan lebih lanjut?

user1626730