Saya berharap mungkin tidak ada jawaban pasti untuk pertanyaan ini. Tetapi saya telah menggunakan sejumlah algoritma pembelajaran mesin di masa lalu dan saya mencoba belajar tentang Bayesian Networks. Saya ingin memahami dalam keadaan apa, atau untuk jenis masalah apa yang Anda pilih untuk menggunakan Bayesian Network daripada pendekatan lain?
12
Jawaban:
Bayesian Networks (BN's) adalah model generatif. Asumsikan Anda memiliki satu set input, , dan output . BN memungkinkan Anda untuk mempelajari distribusi gabungan , sebagai lawan dari katakanlah regresi logistik atau Support Vector Machine, yang memodelkan distribusi bersyarat .Y P ( X , Y ) P ( Y | X )X Y P(X,Y) P(Y|X)
Mempelajari distribusi probabilitas gabungan (model generatif) data lebih sulit daripada mempelajari probabilitas kondisional (model diskriminatif). Namun, yang pertama menyediakan model yang lebih fleksibel di mana Anda dapat menjalankan kueri seperti atau , dll. Dengan model diskriminatif, satu-satunya tujuan Anda adalah untuk mempelajari .P ( X 1 | X 2 = A , X 3 = B ) P ( Y | X )P(X1|Y) P(X1|X2=A,X3=B) P(Y|X)
BN menggunakan DAG untuk meresepkan distribusi bersama. Karenanya mereka adalah model grafis.
Keuntungan:
Ketika Anda memiliki banyak data yang hilang, misalnya dalam kedokteran, BN's bisa sangat efektif sejak memodelkan distribusi bersama (yaitu pernyataan Anda tentang bagaimana data dihasilkan) mengurangi ketergantungan Anda dalam memiliki dataset yang teramati sepenuhnya.
Saat Anda ingin memodelkan suatu domain dengan cara yang transparan secara visual, dan juga bertujuan untuk menangkap hubungan , BN's bisa sangat kuat. Perhatikan bahwa asumsi kausalitas dalam BN's terbuka untuk diperdebatkan.cause→effect
Mempelajari distribusi bersama adalah tugas yang sulit, memodelkannya untuk variabel diskrit (melalui perhitungan tabel probabilitas bersyarat, yaitu CPT) jauh lebih mudah daripada mencoba melakukan hal yang sama untuk variabel kontinu. Jadi BN praktis lebih umum dengan variabel diskrit.
BN tidak hanya memungkinkan inferensi observasional (seperti semua model pembelajaran mesin memungkinkan) tetapi juga intervensi kausal s. Ini adalah keuntungan BN yang sering diabaikan dan kurang dihargai dan terkait dengan alasan kontrafaktual.
sumber
Dalam pengalaman saya, Bayesian Networks bekerja dengan sangat baik ketika ada data kategori dimensi tinggi . Mereka memberikan model yang dapat diartikan, yang (kadang-kadang) membantu dalam memahami bagaimana berbagai variabel berinteraksi.
sumber