Bagaimana cara menggabungkan prakiraan saat variabel respons dalam model peramalan berbeda?

9

pengantar

Dalam peramalan kombinasi, salah satu solusi populer didasarkan pada penerapan beberapa kriteria informasi. Mengambil contoh kriteria Akaike diperkirakan untuk model , orang dapat menghitung perbedaan dari dan kemudian RP_j = e ^ {(AIC ^ * - AIC_j) / 2} dapat ditafsirkan sebagai probabilitas relatif model j menjadi yang benar. Bobot kemudian didefinisikan sebagai jAICjjAICjAIC=minjAICjRPj=e(AICAICj)/2j

wj=RPjjRPj

Masalah

Kesulitan yang saya coba atasi adalah bahwa model-model tersebut diperkirakan pada variabel-variabel respon yang ditransformasikan berbeda (endogen). Sebagai contoh, beberapa model didasarkan pada tingkat pertumbuhan tahunan, yang lain - pada tingkat pertumbuhan kuartal ke kuartal. Dengan demikian nilai AIC_j yang diekstraksi SEBUAHsayaCjtidak dapat dibandingkan secara langsung.

Solusi mencoba

Karena semua yang penting adalah perbedaan SEBUAHsayaC , kita bisa mengambil AIC model dasar SEBUAHsayaC(misalnya saya mencoba mengekstrak lm(y~-1)model tanpa parameter apa pun) yang tidak berubah terhadap transformasi variabel respons dan kemudian membandingkan perbedaan antara model j dan model model dasar SEBUAHsayaC . Berikut namun tampaknya titik tetap lemah - perbedaan tersebut dipengaruhi oleh transformasi variabel respon.

Komentar penutup

Catatan, opsi seperti "perkirakan semua model pada variabel respons yang sama" adalah mungkin, tetapi sangat memakan waktu. Saya ingin mencari "obat" cepat sebelum pergi ke keputusan yang menyakitkan jika tidak ada cara lain untuk menyelesaikan masalah.

Dmitrij Celov
sumber

Jawaban:

1

Saya pikir salah satu metode yang paling dapat diandalkan untuk membandingkan model adalah dengan cross-validate out-of-sample error (misalnya MAE). Anda harus membatalkan transformasi variabel eksogen untuk masing-masing model untuk secara langsung membandingkan apel dengan apel.

Zach
sumber
Cara alternatif yang saya gunakan untuk pendekatan yang lebih memakan waktu adalah dengan menggunakan kesalahan jack-knifed untuk memperkirakan bobot yang serupa dengan Bates dan Granger (1969) dan karya terkait seperti kombinasi dan mencakup Clements dan Harvey Forecasts (2007). Titik lemah dari pendekatan berdasarkan kesalahan perkiraan adalah rata-rata lebih rendah daripada pendekatan berbasis informasi (model). Karena rata-rata Bayesian itu rumit, saya mencoba menerapkan metode yang lebih sederhana yang dapat dianggap sebagai BMA dengan prior priorat.
Dmitrij Celov
Perhatikan, bahwa saya tidak ingin membandingkan dan memilih model terbaik, saya juga tidak mencari metode kombinasi prakiraan terbaik. Saya hanya memiliki masalah membandingkan AIC dari model berdasarkan pada variabel respon yang ditransformasikan berbeda .
Dmitrij Celov
1
@ Dmitrij Celov: Lalu mengapa Anda membandingkan AIC? Perlu diingat bahwa AIC secara asimptotik setara dengan validasi silang keluar-keluar-satu, jadi saya menduga perbandingan kedua metrik akan serupa. stats.stackexchange.com/a/587/2817
Zach
@DmitrijCelov: "Titik lemah dari pendekatan berdasarkan perkiraan kesalahan adalah rata-rata lebih rendah daripada pendekatan berbasis informasi (model)." Lebih rendah dalam hal apa? Apakah Anda memiliki beberapa kutipan atau penjelasan untuk ini? Intuition memberi tahu saya pernyataan ini salah, tetapi intuisi sering salah ...
Zach
Saya mungkin membuat kesimpulan cepat setelah komentar di G.Kapitanious et al kertas kerja Kombinasi ramalan dan kumpulan metode peramalan statistik Bank of England di mana pada hal. 23 tertulis bahwa "... menggabungkan prakiraan secara umum tidak akan menghasilkan prakiraan optimal, sementara menggabungkan informasi akan". Kesetaraan asimptotik bukanlah yang ingin saya miliki dalam sampel kecil data ekonomi makro, tetapi metode sederhana mungkin mengungguli yang lebih kompleks. Cukup validasi silang adalah solusi terbaik kedua, jack-knives diproduksi dalam waktu satu minggu, AIC dalam satu jam. (Kita dapat mengobrol)
Dmitrij Celov