Saya perlu penjelasan satu kalimat tentang penggunaan AIC dalam pembuatan model. Sejauh ini saya telah "Sederhananya, AIC adalah ukuran relatif dari jumlah variasi yang diamati dicatat oleh model yang berbeda dan memungkinkan koreksi untuk kompleksitas model."
Setiap saran sangat dihargai.
R
The AIC is a measure of how well a model fits a dataset, penalizing models that are so flexible that they would also fit unrelated datasets just as well.
Berikut adalah definisi yang menempatkan AIC dalam daftar teknik yang digunakan untuk pemilihan model. AIC hanyalah salah satu dari beberapa cara yang masuk akal untuk menangkap trade-off antara goodness of fit (yang ditingkatkan dengan menambahkan kompleksitas model dalam bentuk variabel penjelas tambahan, atau menambahkan peringatan seperti "tetapi hanya pada hari Kamis, saat hujan") dan kekikiran (lebih sederhana == lebih baik) dalam membandingkan model yang tidak bersarang. Inilah hasil cetaknya:
sumber
Bagaimana tentang:
Jika itu terlalu jauh ke arah non-teknis, beri tahu saya dalam komentar dan saya akan membuat yang lain.
sumber
AIC adalah ukuran seberapa baik data dijelaskan oleh model dikoreksi untuk seberapa kompleks model tersebut.
sumber
Sisi lain dari jawaban luar biasa @ gung:
AIC adalah angka yang mengukur seberapa baik suatu model cocok dengan dataset, pada skala geser yang membutuhkan model yang lebih rumit untuk secara signifikan lebih akurat untuk menilai lebih tinggi.EDIT:
AIC adalah angka yang mengukur seberapa baik suatu model cocok dengan dataset, pada skala geser yang membutuhkan model yang secara signifikan lebih rumit atau fleksibel untuk juga secara signifikan lebih akurat.
sumber
Misalkan k adalah jumlah parameter model dan MaxL adalah nilai fungsi kemungkinan pada maksimumnya. Kemudian Kriteria Informasi Akaike didefinisikan sebagaiA IC= 2 k - 2 ln( M.a x L ) . Tujuannya adalah untuk menemukan model yang meminimalkan AIC.
Dengan definisi ini, AIC adalah kriteria yang digunakan untuk memilih model yang menghasilkan kompromi terbaik antara sparsity dalam jumlah parameter dan kemungkinan maksimum untuk estimasi parameter-parameter tersebut.
sumber