Berurusan dengan data yang hilang dalam model pemulusan eksponensial

14

Tampaknya tidak ada cara standar untuk menangani data yang hilang dalam konteks keluarga pemulusan eksponensial model. Secara khusus, implementasi R yang disebut ets dalam paket perkiraan tampaknya hanya mengambil urutan terpanjang tanpa data yang hilang, dan buku "Peramalan dengan Penghalusan Eksponensial" oleh Hyndman et al. sepertinya tidak berbicara tentang data yang hilang sama sekali.

Saya ingin melakukan sedikit lagi, jika pengguna saya secara eksplisit meminta saya untuk (dan jika data yang hilang tidak terjadi terlalu berdekatan atau dalam periode terlalu banyak yang terpisah satu musim). Secara khusus, apa yang ada dalam pikiran saya adalah sebagai berikut. Selama simulasi, setiap kali saya akan menghadapi hilang nilai , saya akan mengganti perkiraan titik saat ~ y t untuk y t , sehingga ε t = 0 . Ini akan, misalnya, membuat titik data tidak dipertimbangkan untuk proses optimasi parameter.yty~tytεt=0

Setelah saya memiliki kecocokan yang masuk akal untuk parameter, saya dapat memperkirakan standar deviasi dari kesalahan (diasumsikan normal dengan rata-rata ) dan memverifikasi bahwa menggunakan nilai ϵ t yang dihasilkan dari distribusi tersebut tidak mengurangi kemungkinan oleh faktor besar. Saya akan menggunakan nilai-nilai tersebut untuk perkiraan (menggunakan simulasi) juga.0ϵt

Apakah ada kesulitan yang diketahui dengan metode ini?

Erik P.
sumber
Sudahkah Anda mempertimbangkan untuk menggunakan proses gaussian dengan kernel kovarian eksponensial? Sepertinya cara alami untuk menangani data yang hilang dan mendapatkan interval kepercayaan. R memiliki paket GPFit yang dapat Anda lihat.
LE Rogerson

Jawaban:

2

Pendekatan Anda masuk akal. Sepotong komersial perangkat lunak yang dikaitkan dengan saya selama beberapa tahun melakukan hal ini.

Garis besar Anda berlaku untuk Single Exponential Smoothing (SES), tetapi tentu saja Anda bisa menerapkan perlakuan yang sama untuk komponen tren atau musiman. Untuk yang musiman, Anda harus kembali ke siklus musiman penuh, seperti halnya memperbarui.

Alternatif lain tentu saja dengan menginterpolasi nilai-nilai yang hilang. Ini adalah opsi dalam versi yang lebih baru dari ets(..., na.action="na.interp").

Dari sedikit yang saya ketahui tentang model ruang angkasa, seharusnya tidak terlalu sulit untuk hanya memperlakukan data yang hilang sebagai tidak teramati. Saya tidak yakin mengapa ini tidak diterapkan dalam forecastpaket. Pencarian cepat melalui blog Rob Hyndman tidak benar-benar menghasilkan sesuatu yang bermanfaat.

Stephan Kolassa
sumber