Dalam entri Wikipedia untuk kriteria informasi Akaike , kita membaca di bawah Perbandingan dengan BIC (kriteria informasi Bayesian) yang
... AIC / AICc memiliki keunggulan teoritis dibandingkan BIC ... AIC / AICc berasal dari prinsip-prinsip informasi; BIC bukan ... BIC memiliki prioritas 1 / R (di mana R adalah jumlah model kandidat), yang "tidak masuk akal" ... AICc cenderung memiliki keunggulan praktis / kinerja dibandingkan BIC ... AIC secara asimptotik optimal ... BIC tidak optimal asymptotically ... tingkat di mana AIC bertemu ke optimal adalah ... yang terbaik.
Di bagian pembicaraan AIC , ada banyak komentar tentang presentasi bias perbandingan dengan bagian BIC. Seorang kontributor yang frustrasi memprotes bahwa seluruh artikel "berbunyi seperti iklan untuk rokok."
Dalam sumber lain, misalnya tesis ini lampiran jangka waktu klaim untuk AIC tampaknya lebih realistis. Dengan demikian, sebagai layanan kepada masyarakat, kami bertanya:
T: Apakah ada situasi di mana BIC berguna dan AIC tidak?
Tidaklah bermakna untuk bertanya apakah AIC lebih baik daripada BIC. Meskipun dua kriteria pemilihan model yang berbeda ini terlihat sangat mirip, mereka masing-masing dirancang untuk memecahkan masalah yang berbeda secara mendasar. Jadi, Anda harus memilih kriteria pemilihan model yang sesuai untuk masalah yang Anda miliki.
AIC adalah rumus perkiraan nilai yang diharapkan dari dua kali log negatif kemungkinan data uji menggunakan model probabilitas yang ditentukan dengan benar yang parameternya diperoleh dengan menyesuaikan model ke data pelatihan. Yaitu, AIC memperkirakan kesalahan validasi silang yang diharapkan menggunakan kesalahan log negatif. Itu adalah,AIC≈E{−2log∏ni=1p(xi|θ^n)}
Dimana x1,…,xn adalah data uji, θ^n diperkirakan menggunakan data pelatihan, dan E{} menunjukkan operator ekspektasi sehubungan dengan proses menghasilkan data iid yang menghasilkan data pelatihan dan tes.
BIC di sisi lain tidak dirancang untuk memperkirakan kesalahan validasi silang. BIC memperkirakan dua kali logaritma negatif dari kemungkinan data yang diamati diberikan model. Kemungkinan ini juga disebut kemungkinan marjinal yang dihitung dengan mengintegrasikan fungsi kemungkinan yang ditimbang oleh suatu parameter sebelump(θ) lebih dari ruang parameter. Itu adalah,
BIC≈−2log∫[∏ni=1p(xi|θ)]p(θ)dθ .
sumber