Saya memiliki seri waktu harian yang cukup dapat diprediksi dengan musiman mingguan. Saya dapat membuat prediksi yang tampaknya cukup akurat (dikonfirmasi oleh validasi silang) ketika tidak ada hari libur. Namun, ketika ada hari libur, saya memiliki masalah berikut:
- Saya mendapatkan angka bukan nol untuk liburan dalam perkiraan saya, meskipun semua liburan historis adalah 0. Ini sebenarnya bukan masalah utama. Masalahnya adalah ...
- Karena pemrosesan yang tidak terjadi pada hari libur "tumpah" ke hari-hari setelah liburan, variabel dummy sederhana tidak memotongnya, karena pencilan ini tampaknya bersifat inovasi jangka pendek. Jika tidak ada musiman mingguan, saya mungkin bisa membuat perkiraan untuk mendistribusikan data yang belum diproses pada hari libur selama lima hari atau lebih setelah liburan (seperti yang disarankan dalam Bagaimana Anda membuat variabel yang mencerminkan dampak utama dan keterlambatan liburan / efek kalender dalam analisis deret waktu? ). Namun, distribusi "limpahan" tergantung pada hari di mana liburan terjadi, dan apakah liburan itu Natal atau Thanksgiving, di mana pesanan ditempatkan pada tingkat yang lebih rendah daripada sisa tahun ini.
Berikut adalah beberapa potret dari validasi silang saya yang menunjukkan hasil yang diprediksi (biru) vs hasil (merah) yang sebenarnya untuk liburan yang muncul pada hari yang berbeda dalam seminggu:
Saya juga khawatir bahwa dampak Natal tergantung pada hari minggu itu jatuh, dan saya hanya memiliki enam atau lebih tahun data historis.
Apakah ada yang punya saran untuk bagaimana menghadapi jenis outlier inovasi dalam konteks perkiraan? (Sayangnya saya tidak bisa membagikan data apa pun)
sumber
Jawaban:
Tidak bisakah Anda membuat variabel dummy untuk liburan, satu untuk liburan + 1 dan satu untuk liburan + 2 dan hanya menetapkan mereka menjadi 1 selama mereka jatuh pada hari kerja?
Sedangkan untuk Thanksgiving dan Natal, memperkenalkan variabel dummy terpisah untuk liburan ini tampaknya menjadi pilihan kasus terburuk Anda (karena Anda hanya memiliki enam tahun data). Sampai batas tertentu, itu mungkin satu-satunya pilihan Anda - orang hanya berperilaku berbeda pada hari libur itu daripada pada hari itu, misalnya, Empat Juli (dan jika Anda mempelajari misalnya pola penjualan ritel, maka Anda tentu harus hidup dengan itu menjadi liburan "istimewa" dan pasti ingin menganalisisnya secara terpisah). Namun, mungkin gagasan di bawah ini bermanfaat bagi Anda:
Saya harap ini membantu.
sumber