Saya bermain-main dengan beberapa unit root testing di R dan saya tidak sepenuhnya yakin apa yang harus dilakukan dari parameter k lag. Saya menggunakan tes Dickey Fuller yang ditambah dan tes Philipps Perron dari paket tseries . Jelas parameter default (untuk ) hanya bergantung pada panjang seri. Jika saya memilih nilai k yang berbeda, saya mendapatkan hasil yang sangat berbeda. menolak nol:adf.test
Dickey-Fuller = -3.9828, Lag order = 4, p-value = 0.01272
alternative hypothesis: stationary
# 103^(1/3)=k=4
Dickey-Fuller = -2.7776, Lag order = 0, p-value = 0.2543
alternative hypothesis: stationary
# k=0
Dickey-Fuller = -2.5365, Lag order = 6, p-value = 0.3542
alternative hypothesis: stationary
# k=6
ditambah hasil tes PP:
Dickey-Fuller Z(alpha) = -18.1799, Truncation lag parameter = 4, p-value = 0.08954
alternative hypothesis: stationary
Ada petunjuk?
r
time-series
trend
hans0l0
sumber
sumber
Jawaban:
Sudah lama sejak saya melihat tes ADF, namun saya ingat setidaknya dua versi tes ADF.
http://www.stat.ucl.ac.be/ISdidactique/Rhelp/library/tseries/html/adf.test.html
http://cran.r-project.org/web/packages/fUnitRoots/
Paket fUnitRoots memiliki fungsi yang disebut adfTest (). Saya pikir masalah "tren" ditangani secara berbeda dalam paket-paket itu.
Sunting ------ Dari halaman 14 tautan berikut, ada 4 versi (uroot dihentikan) dari tes adf:
http://math.uncc.edu/~zcai/FinTS.pdf
Satu lagi tautan. Baca bagian 6.3 di tautan berikut. Itu pekerjaan yang jauh lebih baik daripada yang bisa saya lakukan dalam menjelaskan istilah lag:
http://www.yats.com/doc/cointegration-en.html
Juga, saya akan berhati-hati dengan model musiman apa pun. Kecuali Anda yakin ada hadiah musiman, saya akan menghindari penggunaan istilah musiman. Mengapa? Apa pun bisa dipecah menjadi istilah musiman, bahkan jika tidak. Berikut ini dua contoh:
Grafik di bawah ini berasal dari pernyataan plot di atas (x.stl). stl () menemukan istilah musiman kecil dalam white noise. Anda mungkin mengatakan bahwa istilah itu sangat kecil sehingga benar-benar tidak menjadi masalah. Masalahnya adalah, dalam data nyata, Anda tidak tahu apakah istilah itu masalah atau tidak. Pada contoh di bawah ini, perhatikan bahwa seri data tren memiliki segmen yang terlihat seperti versi yang disaring dari data mentah, dan segmen lain yang mungkin dianggap berbeda secara signifikan dari data mentah.
sumber
Parameter k adalah seperangkat lag yang ditambahkan untuk mengatasi korelasi serial. A dalam ADF berarti bahwa tes ini ditambah dengan penambahan kelambatan. Pemilihan jumlah kelambatan dalam ADF dapat dilakukan dengan berbagai cara. Cara yang umum adalah memulai dengan sejumlah besar lag yang dipilih apriori dan mengurangi jumlah lag secara berurutan sampai lag yang terpanjang signifikan secara statistik.
Anda bisa menguji korelasi serial dalam residu setelah menerapkan kelambatan dalam ADF.
sumber