Metode inferensi MaxEnt dan Bayesian berhubungan dengan berbagai cara menggabungkan informasi ke dalam prosedur pemodelan Anda. Keduanya dapat diletakkan di atas landasan aksiomatik ( "Aksioma Entropi Maksimal" karya John Skilling dan "Aljabar Kemungkinan Kemungkinan" karya Cox ).
Pendekatan Bayesian mudah diterapkan jika pengetahuan Anda sebelumnya datang dalam bentuk fungsi bernilai riil yang terukur atas ruang hipotesis Anda, yang disebut "prior". MaxEnt mudah ketika informasi itu datang sebagai sekumpulan kendala keras pada ruang hipotesis Anda. Dalam kehidupan nyata, pengetahuan tidak datang dalam bentuk "sebelumnya" atau dalam bentuk "kendala", sehingga keberhasilan metode Anda tergantung pada kemampuan Anda untuk mewakili pengetahuan Anda dalam bentuk yang sesuai.
Pada masalah mainan, rata-rata model Bayesian akan memberi Anda kehilangan log rata-rata terendah ( rata-rata di atas banyak model menarik) ketika sebelumnya cocok dengan distribusi hipotesis yang sebenarnya. Pendekatan MaxEnt akan memberi Anda log-loss terendah terburuk saat kendala terpenuhi (terburuk diambil alih semua kemungkinan prior)
ETJaynes, dianggap sebagai bapak metode "MaxEnt" juga mengandalkan metode Bayesian. Pada halaman 1412 dari bukunya , ia memberikan contoh di mana pendekatan Bayesian menghasilkan solusi yang baik, diikuti oleh contoh di mana pendekatan MaxEnt lebih alami.
Kemungkinan maksimum pada dasarnya membawa model untuk berada di dalam ruang model yang telah ditentukan sebelumnya dan berusaha menyesuaikannya "sekeras mungkin" dalam arti bahwa ia akan memiliki sensitivitas tertinggi terhadap data dari semua metode pemilihan model yang terbatas pada model tersebut ruang. Sedangkan MaxEnt dan Bayesian adalah kerangka kerja, ML adalah metode pemasangan model konkret, dan untuk beberapa pilihan desain tertentu, ML dapat berakhir dengan metode yang keluar dari pendekatan Bayesian atau MaxEnt. Misalnya, MaxEnt dengan kendala kesetaraan setara dengan Maximum Likelihood fitting dari keluarga eksponensial tertentu. Demikian pula, perkiraan Bayesian Inference dapat mengarah pada solusi Maximum Likelihood yang diatur. Jika Anda memilih sebelum membuat kesimpulan Anda peka terhadap data, hasil inferensi Bayesian akan sesuai dengan pemasangan Kemungkinan Maksimum. Contohnya,hal
Keberhasilan Pembelajaran Mesin kehidupan nyata seringkali merupakan campuran dari berbagai filosofi. Misalnya, "Bidang Acak" berasal dari prinsip MaxEnt. Implementasi ide yang paling populer, CRF yang teregulasi, melibatkan penambahan "prior" pada parameter. Akibatnya, metode ini tidak benar-benar MaxEnt atau Bayesian, tetapi dipengaruhi oleh kedua aliran pemikiran.
Saya telah mengumpulkan beberapa tautan pada landasan filosofis pendekatan Bayesian dan MaxEnt di sini dan di sini .
Catatan tentang terminologi: kadang-kadang orang memanggil metode mereka Bayesian hanya jika menggunakan aturan Bayes di beberapa titik. Demikian juga, "MaxEnt" kadang-kadang digunakan untuk beberapa metode yang mendukung solusi entropi tinggi. Ini tidak sama dengan "inferensi MaxEnt" atau "inferensi Bayesian" seperti dijelaskan di atas
Untuk kritik yang menghibur tentang metode entropi maksimum, saya akan merekomendasikan membaca beberapa posting newsgroup lama di sci.stat.math dan sci.stat.consult, terutama yang oleh Radford Neal:
Saya tidak mengetahui adanya perbandingan antara metode maxent dan lainnya: bagian dari masalah tampaknya adalah bahwa maxent sebenarnya bukan kerangka kerja, tetapi arahan ambigu ("ketika dihadapkan dengan sesuatu yang tidak diketahui, cukup maksimalkan entropi"), yang merupakan ditafsirkan dengan cara yang berbeda oleh orang yang berbeda.
sumber
Memang benar bahwa di masa lalu, MaxEnt dan Bayes telah berurusan dengan berbagai jenis atau bentuk informasi. Saya akan mengatakan bahwa Bayes menggunakan kendala "keras" juga, kemungkinannya.
Bagaimanapun, itu bukan masalah lagi karena Bayes Rule (bukan aturan produk) dapat diperoleh dari Entropy relatif maksimum (MrE), dan tidak dengan cara yang ambigu:
Ini dunia baru ...
sumber