Tampaknya tidak ada cara standar untuk menangani data yang hilang dalam konteks keluarga pemulusan eksponensial model. Secara khusus, implementasi R yang disebut ets dalam paket perkiraan tampaknya hanya mengambil urutan terpanjang tanpa data yang hilang, dan buku "Peramalan dengan Penghalusan Eksponensial" oleh Hyndman et al. sepertinya tidak berbicara tentang data yang hilang sama sekali.
Saya ingin melakukan sedikit lagi, jika pengguna saya secara eksplisit meminta saya untuk (dan jika data yang hilang tidak terjadi terlalu berdekatan atau dalam periode terlalu banyak yang terpisah satu musim). Secara khusus, apa yang ada dalam pikiran saya adalah sebagai berikut. Selama simulasi, setiap kali saya akan menghadapi hilang nilai , saya akan mengganti perkiraan titik saat ~ y t untuk y t , sehingga ε t = 0 . Ini akan, misalnya, membuat titik data tidak dipertimbangkan untuk proses optimasi parameter.
Setelah saya memiliki kecocokan yang masuk akal untuk parameter, saya dapat memperkirakan standar deviasi dari kesalahan (diasumsikan normal dengan rata-rata ) dan memverifikasi bahwa menggunakan nilai ϵ t yang dihasilkan dari distribusi tersebut tidak mengurangi kemungkinan oleh faktor besar. Saya akan menggunakan nilai-nilai tersebut untuk perkiraan (menggunakan simulasi) juga.
Apakah ada kesulitan yang diketahui dengan metode ini?
sumber
Jawaban:
Pendekatan Anda masuk akal. Sepotong komersial perangkat lunak yang dikaitkan dengan saya selama beberapa tahun melakukan hal ini.
Garis besar Anda berlaku untuk Single Exponential Smoothing (SES), tetapi tentu saja Anda bisa menerapkan perlakuan yang sama untuk komponen tren atau musiman. Untuk yang musiman, Anda harus kembali ke siklus musiman penuh, seperti halnya memperbarui.
Alternatif lain tentu saja dengan menginterpolasi nilai-nilai yang hilang. Ini adalah opsi dalam versi yang lebih baru dari
ets(..., na.action="na.interp")
.Dari sedikit yang saya ketahui tentang model ruang angkasa, seharusnya tidak terlalu sulit untuk hanya memperlakukan data yang hilang sebagai tidak teramati. Saya tidak yakin mengapa ini tidak diterapkan dalam
forecast
paket. Pencarian cepat melalui blog Rob Hyndman tidak benar-benar menghasilkan sesuatu yang bermanfaat.sumber