Saat menghitung AIC,
k berarti 'jumlah parameter'. Tapi apa yang dianggap sebagai parameter? Jadi misalnya dalam model
Apakah a dan b selalu dihitung sebagai parameter? Bagaimana jika saya tidak peduli dengan nilai intersep, dapatkah saya mengabaikannya atau masih menghitungnya?
Bagaimana jika
di mana adalah fungsi dari c dan x, apakah sekarang saya menghitung 3 parameter?
Jawaban:
Seperti yang disebutkan mugen, mewakili jumlah parameter yang diestimasi . Dengan kata lain, ini adalah jumlah jumlah tambahan yang perlu Anda ketahui untuk menentukan model secara penuh. Dalam model regresi linier sederhana y = a x + b, Anda dapat memperkirakank
Jika model Anda adalah jumlah parameter tergantung pada apakah Anda memperbaiki salah satu dari nilai-nilai ini, dan pada bentuk f . Sebagai contoh, jika kita ingin memperkirakan a , b , c dan tahu bahwa f ( c , x ) = x c
Sangat penting bahwa adalah keluarga fungsi yang diindeks oleh c . Jika yang Anda tahu adalah bahwa f ( c , x ) kontinu dan itu tergantung pada c dan x , maka Anda kurang beruntung karena ada banyak fungsi kontinu yang tak terhitung jumlahnya.f(c,x) c f(c,x) c x
sumber
(lihat disini )
Seperti yang Anda lihat, mewakili jumlah parameter yang diestimasi dalam setiap model. Jika model Anda menyertakan intersep (yaitu, jika Anda menghitung estimasi titik, varians, dan interval kepercayaan untuk intersep) maka dihitung sebagai parameter. Di sisi lain, jika Anda menghitung model tanpa intersep, itu tidak masuk hitungan.k
Ingatlah bahwa AIC tidak hanya merangkum goodness of fit tetapi juga mempertimbangkan kompleksitas model. Itu sebabnya ada, untuk menghukum model dengan lebih banyak parameter.k
Saya tidak merasa cukup berpengetahuan untuk menjawab pertanyaan kedua Anda, saya akan meninggalkannya untuk anggota lain dari komunitas.
sumber
Pertama, bagi mereka yang mungkin tidak terbiasa dengan AIC: Akaike Information Criterion (AIC) adalah metrik sederhana yang dirancang untuk membandingkan "kebaikan" model.
Menurut AIC, ketika mencoba untuk memilih antara dua model berbeda yang menerapkan input dan variabel respon yang sama , yaitu model yang dirancang untuk memecahkan masalah yang sama, model dengan AIC yang lebih rendah dianggap "lebih baik".
c
sumber