Kapan menggunakan Bayesian Networks melalui pendekatan pembelajaran mesin lainnya?

12

Saya berharap mungkin tidak ada jawaban pasti untuk pertanyaan ini. Tetapi saya telah menggunakan sejumlah algoritma pembelajaran mesin di masa lalu dan saya mencoba belajar tentang Bayesian Networks. Saya ingin memahami dalam keadaan apa, atau untuk jenis masalah apa yang Anda pilih untuk menggunakan Bayesian Network daripada pendekatan lain?

AndyC
sumber
3
Bagi saya Bayesian Networks adalah cara untuk mendefinisikan independensi bersyarat dalam suatu model. Setelah Anda menentukan itu, saya kira Anda dapat menggunakan berbagai alat pembelajaran untuk memperkirakan parameter model. Jadi, saya melihat pemisahan yang jelas antara pembelajaran parameter dan model. Namun, saya bukan ahli dalam hal ini sehingga seseorang dapat datang dengan jawaban yang lebih baik.
Luca

Jawaban:

7

Bayesian Networks (BN's) adalah model generatif. Asumsikan Anda memiliki satu set input, , dan output . BN memungkinkan Anda untuk mempelajari distribusi gabungan , sebagai lawan dari katakanlah regresi logistik atau Support Vector Machine, yang memodelkan distribusi bersyarat .Y P ( X , Y ) P ( Y | X )XYP(X,Y)P(Y|X)

Mempelajari distribusi probabilitas gabungan (model generatif) data lebih sulit daripada mempelajari probabilitas kondisional (model diskriminatif). Namun, yang pertama menyediakan model yang lebih fleksibel di mana Anda dapat menjalankan kueri seperti atau , dll. Dengan model diskriminatif, satu-satunya tujuan Anda adalah untuk mempelajari .P ( X 1 | X 2 = A , X 3 = B ) P ( Y | X )P(X1|Y)P(X1|X2=A,X3=B)P(Y|X)

BN menggunakan DAG untuk meresepkan distribusi bersama. Karenanya mereka adalah model grafis.

Keuntungan:

  1. Ketika Anda memiliki banyak data yang hilang, misalnya dalam kedokteran, BN's bisa sangat efektif sejak memodelkan distribusi bersama (yaitu pernyataan Anda tentang bagaimana data dihasilkan) mengurangi ketergantungan Anda dalam memiliki dataset yang teramati sepenuhnya.

  2. Saat Anda ingin memodelkan suatu domain dengan cara yang transparan secara visual, dan juga bertujuan untuk menangkap hubungan , BN's bisa sangat kuat. Perhatikan bahwa asumsi kausalitas dalam BN's terbuka untuk diperdebatkan.causeeffect

  3. Mempelajari distribusi bersama adalah tugas yang sulit, memodelkannya untuk variabel diskrit (melalui perhitungan tabel probabilitas bersyarat, yaitu CPT) jauh lebih mudah daripada mencoba melakukan hal yang sama untuk variabel kontinu. Jadi BN praktis lebih umum dengan variabel diskrit.

  4. BN tidak hanya memungkinkan inferensi observasional (seperti semua model pembelajaran mesin memungkinkan) tetapi juga intervensi kausal s. Ini adalah keuntungan BN yang sering diabaikan dan kurang dihargai dan terkait dengan alasan kontrafaktual.

Zhubarb
sumber
1
Dalam keuntungan 1 di mana Anda mengatakan BN efektif untuk memodelkan data dengan banyak nilai yang hilang, tidakkah nilai-nilai yang hilang ini mempengaruhi identifikasi independensi yang benar dalam data?
Hossein
1
Ya, saat memasang model Anda masih perlu menyalahkan dengan beberapa asumsi, tetapi begitu Anda memiliki struktur untuk, misalnya , tergantung pada faktorisasi DAG Anda (yang merangkum asumsi independensi Anda), Anda mungkin tidak perlu jika sudah tersedia, atau sebaliknya. X 1 X 2P(Y,X1,X2)X1X2
Zhubarb
1

Dalam pengalaman saya, Bayesian Networks bekerja dengan sangat baik ketika ada data kategori dimensi tinggi . Mereka memberikan model yang dapat diartikan, yang (kadang-kadang) membantu dalam memahami bagaimana berbagai variabel berinteraksi.

Berjemur
sumber