Saya punya pertanyaan dasar tentang pendekatan untuk pemodelan rata-rata menggunakan kriteria IT untuk model berat dalam satu set kandidat.
Sebagian besar sumber yang saya baca tentang model rata-rata menganjurkan rata-rata estimasi koefisien parameter berdasarkan bobot model (baik menggunakan 'rata-rata alami' atau metode 'rata-rata nol'). Namun, saya mendapat kesan bahwa rata-rata dan menimbang prediksi masing-masing model , daripada perkiraan koefisien parameter, berdasarkan bobot model adalah pendekatan yang lebih mudah dan tepat, terutama jika membandingkan model dengan variabel prediktor yang tidak bersarang.
Apakah ada panduan yang jelas tentang pendekatan mana untuk model rata-rata yang paling dibenarkan (rata-rata estimasi parameter berbobot vs prediksi berbobot)? Juga, apakah ada komplikasi lebih lanjut dengan model rata-rata estimasi koefisien dalam kasus model campuran?
sumber
Jawaban:
Dalam model linier, rata-rata lintas koefisien akan memberi Anda nilai prediksi yang sama dengan nilai prediksi dari rata-rata prediksi, tetapi menyampaikan lebih banyak informasi. Banyak paparan berurusan dengan model linier dan karenanya rata-rata lintas koefisien.
Anda dapat memeriksa kesetaraan dengan sedikit aljabar linier. Katakan sudahT pengamatan dan N prediktor. Anda mengumpulkan yang terakhir diT×N matriks X . Kamu juga punyaM model, yang masing-masing memberikan estimasi koefisien βm ke N prediktor. Tumpuk estimasi koefisien ini diN×M matriks β . Rata-rata berarti Anda menetapkan bobotwm untuk masing-masing model m (Bobot biasanya non-negatif dan jumlah hingga satu). Masukkan bobot ini dalam vektorw panjangnya M .
Nilai prediksi untuk masing-masing model diberikan olehy^m=Xβm , atau, dalam notasi bertumpuk
Dalam model non-linear, ekuivalensi biasanya tidak berlaku lagi dan di sana, memang masuk akal untuk rata-rata prediksi. Literatur yang luas tentang rata-rata prediksi (kombinasi perkiraan) misalnya dirangkum di sini .
sumber