Saya bekerja pada kumpulan data electricity
yang tersedia dalam paket R TSA
. Tujuan saya adalah untuk mengetahui apakah suatu arima
model akan sesuai untuk data ini dan pada akhirnya cocok. Jadi saya melanjutkan sebagai berikut:
1: Plot deret waktu yang dihasilkan jika grafik berikut:
ke-2: Saya ingin mengambil log electricity
untuk menstabilkan varians dan kemudian membedakan deret tersebut sesuai, tetapi sebelum melakukannya, saya menguji stasioneritas pada kumpulan data asli menggunakan adf
tes (Augmented Dickey Fuller) dan secara mengejutkan, hasilnya adalah sebagai berikut:
Kode dan Hasil:
adf.test(electricity)
Augmented Dickey-Fuller Test
data: electricity
Dickey-Fuller = -9.6336, Lag order = 7, p-value = 0.01
alternative hypothesis: stationary
Warning message: In adf.test(electricity) : p-value smaller than printed p-value
Nah, sesuai dengan gagasan pemula saya tentang deret waktu, saya kira itu berarti bahwa data itu stasioner (nilai-p kecil, tolak hipotesis nol non-stasioneritas). Tetapi melihat plot ts, saya tidak menemukan cara ini bisa diam. Apakah ada yang punya penjelasan yang valid untuk ini?
sumber
Jawaban:
Karena Anda mengambil nilai default k dalamxt- xt - 1
adf.test
, yang dalam hal ini adalah 7, pada dasarnya Anda menguji apakah kumpulan informasi selama 7 bulan terakhir membantu menjelaskan . Penggunaan listrik memiliki musiman yang kuat, seperti yang ditunjukkan plot Anda, dan kemungkinan akan berulang setelah 7 bulan. Jika Anda menetapkan k = 12 dan menguji ulang, null dari unit root tidak dapat ditolak,sumber
Dengan asumsi bahwa "adf.test" benar-benar berasal dari paket "tseries" (secara langsung atau tidak langsung), alasannya adalah karena paket itu secara otomatis menyertakan tren waktu linier. Dari dokumen tseries (versi 0.10-35): "Persamaan regresi umum yang menggabungkan tren konstan dan linear digunakan [...]" Jadi hasil tes memang menunjukkan tren stasioneritas (yang walaupun namanya tidak stasioner).
Saya juga setuju dengan Pantera bahwa efek musiman dapat mengubah hasil. Serial ini sebenarnya bisa menjadi tren waktu + deterministik musiman + proses unit stochastic root, tetapi tes ADF mungkin salah menafsirkan fluktuasi musiman sebagai pembalikan stokastik ke tren deterministik, yang akan menyiratkan akar lebih kecil dari kesatuan. (Di sisi lain, mengingat Anda telah memasukkan cukup jeda, ini seharusnya lebih terlihat sebagai unit (spurious) yang berakar pada frekuensi musiman, bukan frekuensi nol / jangka panjang yang dilihat oleh tes ADF. Dalam kasus apa pun, berikan pola musiman lebih baik untuk memasukkan musim.)
sumber