Bagaimana cara mengetahui apakah deret waktu stasioner atau non stasioner?

30

Saya menggunakan R, Aku mencari di Google dan belajar bahwa kpss.test(), PP.test(), dan adf.test()digunakan untuk mengetahui stasioneritas dari time series.

Tapi saya bukan ahli statistik, yang bisa menafsirkan hasil mereka

> PP.test(x)

     Phillips-Perron Unit Root Test
data:  x 
Dickey-Fuller = -30.649, Truncation lag parameter = 7, p-value = 0.01

> kpss.test(b$V1)

  KPSS Test for Level Stationarity
  data:  b$V1 
  KPSS Level = 0.0333, Truncation lag parameter = 3, p-value = 0.1

Warning message:
In kpss.test(b$V1) : p-value greater than printed p-value
> adf.test(x)

    Augmented Dickey-Fuller Test

data:  x 
Dickey-Fuller = -9.6825, Lag order = 9, p-value = 0.01
alternative hypothesis: stationary

Warning message:
In adf.test(x) : p-value smaller than printed p-value

Saya berurusan dengan ribuan deret waktu, mohon beri tahu saya cara mengecek secara kuantitatif tentang stasioneritas deret waktu.

Sagar Nikam
sumber

Jawaban:

22

Menguji apakah suatu seri stasioner versus non-stasioner mengharuskan Anda mempertimbangkan serangkaian hipotesis alternatif. Satu untuk setiap Asumsi Gaussian yang dapat didaftarkan. Kita harus memahami bahwa Asumsi Gaus adalah semua tentang proses kesalahan dan tidak ada hubungannya dengan seri yang diamati dalam evaluasi. Seperti yang dirangkum dengan benar oleh StasK, ini dapat mencakup pelanggaran stasioneritas, seperti perubahan rerata, perubahan ragam, perubahan dalam parameter model dari waktu ke waktu. Sebagai contoh, seperangkat nilai tren ke atas akan menjadi contoh prima facie dari rangkaian yang dalam Y tidak konstan sedangkan residu dari model yang sesuai dapat digambarkan memiliki rata-rata konstan. Dengan demikian seri aslinya adalah tidak stasioner dalam mean tetapi seri residual stasioner dalam mean. Jika ada pelanggaran rata-rata yang tidak dikurangi dalam seri residu seperti Pulsa, Pergeseran Level, Pulsa Musiman dan / atau Tren Waktu Lokal maka seri residual (tidak diobati) dapat dikategorikan sebagai non-stasioner dalam mean sementara serangkaian variabel indikator dapat berupa mudah dideteksi dan dimasukkan ke dalam model untuk membuat model residual stasioner dalam rata-rata. Sekarang jika varian dari seri asli menunjukkan varian non-stasioner, cukup masuk akal untuk menyaring filter / model untuk membuat proses kesalahan yang memiliki varian konstan. Demikian pula residu dari model mungkin memiliki varian tidak konstan yang memerlukan satu dari tiga kemungkinan solusi - Pulsa Musiman dan / atau Tren Waktu Lokal maka seri residu (tidak diobati) dapat dikategorikan sebagai non-stasioner dalam rerata sementara serangkaian variabel indikator dapat dengan mudah dideteksi dan dimasukkan ke dalam model untuk membuat model residual stasioner dalam rerata . Sekarang jika varian dari seri asli menunjukkan varian non-stasioner, cukup masuk akal untuk menyaring filter / model untuk membuat proses kesalahan yang memiliki varian konstan. Demikian pula residu dari model mungkin memiliki varian tidak konstan yang memerlukan satu dari tiga kemungkinan solusi - Pulsa Musiman dan / atau Tren Waktu Lokal maka seri residu (tidak diobati) dapat dikategorikan sebagai non-stasioner dalam rerata sementara serangkaian variabel indikator dapat dengan mudah dideteksi dan dimasukkan ke dalam model untuk membuat model residual stasioner dalam rerata . Sekarang jika varian dari seri asli menunjukkan varian non-stasioner, cukup masuk akal untuk menyaring filter / model untuk membuat proses kesalahan yang memiliki varian konstan. Demikian pula residu dari model mungkin memiliki varian tidak konstan yang memerlukan satu dari tiga kemungkinan solusi - Sekarang jika varian dari seri asli menunjukkan varian non-stasioner, cukup masuk akal untuk menyaring filter / model untuk membuat proses kesalahan yang memiliki varian konstan. Demikian pula residu dari model mungkin memiliki varian tidak konstan yang memerlukan satu dari tiga kemungkinan solusi - Sekarang jika varian dari seri asli menunjukkan varian non-stasioner, cukup masuk akal untuk menyaring filter / model untuk membuat proses kesalahan yang memiliki varian konstan. Demikian pula residu dari model mungkin memiliki varian tidak konstan yang memerlukan satu dari tiga kemungkinan solusi -

  1. Weighted Least Squares (diabaikan oleh beberapa analis)
  2. Transformasi daya untuk memisahkan nilai yang diharapkan dari varian kesalahan yang dapat diidentifikasi melalui uji Box-Cox dan / atau
  3. Kebutuhan akan model GARCH untuk memperhitungkan struktur ARIMA yang jelas dalam residu kuadrat. Melanjutkan jika parameter berubah seiring waktu ATAU bentuk model berubah dari waktu ke waktu maka seseorang dihadapkan dengan kebutuhan untuk mendeteksi karakteristik ini dan memperbaikinya dengan segmentasi data atau pemanfaatan pendekatan TAR à la Tong.
IrishStat
sumber
34

yt=dosat

yt=yt-1+ϵt
yt-2yt-3dengan koefisien kecil). Ini adalah model sederhana dari pasar keuangan yang efisien, di mana tidak ada informasi apa pun yang dapat digunakan untuk memprediksi perubahan harga di masa depan. Sebagian besar ekonom berpikir tentang deret waktu mereka berasal dari model ARIMA; seri waktu ini memiliki periode yang ditentukan dengan baik ketika hal-hal terjadi (bulan, kuartal, atau tahun), sehingga jarang menjadi lebih buruk daripada seri waktu terintegrasi untuk mereka. Jadi tes ini tidak dirancang untuk pelanggaran yang lebih kompleks dari stasioneritas, seperti perubahan rerata, perubahan ragam, perubahan dalam koefisien autoregresif, dll., Meskipun tes untuk efek ini jelas telah dikembangkan juga.

Dalam ilmu teknik atau alam, Anda lebih mungkin menemukan rangkaian waktu dengan masalah yang lebih rumit, seperti ketergantungan jangka panjang, integrasi fraksional, noise merah muda, dll. Dengan kurangnya panduan yang jelas dari deskripsi proses mengenai skala waktu yang khas ( seberapa sering perubahan iklim?), biasanya lebih masuk akal untuk menganalisis data dalam domain frekuensi (sementara untuk ekonom, domain frekuensi cukup jelas: ada siklus musiman tahunan, ditambah lagi siklus bisnis 3-4-5 tahun ; beberapa kejutan dapat terjadi sebaliknya).

hal0,05/(3M.)M.30,05halpp.test(x)$p.value

Tugas
sumber
4

Rangkaian waktu stasioner jika level rata-rata dan variansnya tetap stabil dari waktu ke waktu. Anda dapat membaca lebih lanjut tentang topik ini (dengan spesifikasi tes yang relevan dalam R), di posting kami .. http://www.statosphere.com.au/check-time-series-stationary-r/

STAToSphere
sumber
1
Komentar yang terlambat, tetapi apa maksud Anda maksud dan varian tetap stabil dari waktu ke waktu? Untuk set data tertentu, mean dan varians adalah apa adanya, bukan? Atau maksud Anda bahwa mean / var dari semua himpunan bagian data harus sama?
Erik Vesterlund
2
Saya melihat halaman yang tertaut. Dinyatakan bahwa "Tes Ljung-Box memeriksa apakah ada bukti signifikan untuk korelasi non-nol pada keterlambatan 1-20. Nilai p kecil (yaitu, kurang dari 0,05) menunjukkan bahwa seri ini stasioner." Kesimpulannya jelas salah. Yang batal adalah pengamatannya benar. Menolak nol berdasarkan nilai p kecil hanya menunjukkan bahwa setidaknya ada satu lag yang signifikan. Kesimpulan di situs web akan berarti, bahwa stasioneritas membutuhkan autokorelasi yang signifikan untuk setidaknya satu lag. Dan itu tidak benar.
random_guy