Rangkaian waktu biologis multivarian: VAR dan musiman

15

Saya memiliki dataset deret waktu multivarian termasuk variabel biologis dan lingkungan yang berinteraksi (ditambah beberapa variabel eksogen). Selain musiman, tidak ada tren jangka panjang yang jelas dalam data. Tujuan saya adalah untuk melihat variabel mana yang terkait satu sama lain. Peramalan tidak benar-benar dicari.

Menjadi orang baru dalam analisis deret waktu, saya membaca beberapa referensi. Sejauh yang saya mengerti, model Vector Autoregressive (VAR) akan sesuai, tetapi saya tidak merasa nyaman dengan musiman dan sebagian besar contoh saya menemukan bidang ekonomi yang bersangkutan (seperti sering dengan analisis deret waktu ...) tanpa musiman.

Apa yang harus saya lakukan dengan data musiman saya? Saya mempertimbangkan deseasonalisasi mereka - misalnya dalam R, saya akan menggunakan decomposedan kemudian menggunakan $trend + $randnilai - nilai untuk mendapatkan sinyal yang tampak cukup stasioner (sebagaimana dinilai per acf). Hasil dari model VAR membingungkan saya (model 1-lag dipilih sementara saya secara intuitif mengharapkan lebih, dan hanya koefisien untuk autoregresi - dan bukan untuk regresi dengan variabel lagged lainnya - yang signifikan). Apakah saya melakukan sesuatu yang salah, atau haruskah saya menyimpulkan bahwa variabel saya tidak terkait (linier) / model saya tidak bagus (pertanyaan tambahan: apakah ada persamaan non-linear dengan VAR?).

[Atau, saya membaca saya mungkin bisa menggunakan variabel musiman dummy, meskipun saya tidak tahu persis bagaimana menerapkannya].

Saran langkah demi langkah akan sangat dihargai, karena detail untuk pengguna berpengalaman mungkin benar-benar informatif bagi saya (dan cuplikan kode R atau tautan ke contoh nyata sangat diterima, tentu saja).

ztl
sumber
2
Banyak tergantung pada bagaimana Anda berpikir tentang musiman. Bacaan literatur saya yang tidak lengkap menunjukkan bahwa para ekonom sering menganggap musiman sebagai gangguan yang tidak menarik sementara para ilmuwan lingkungan sering merasa jauh lebih positif tentang hal itu. Metode variabel tiruan seperti yang digunakan dalam ekonomi bergantung, sering, pada data yang triwulanan atau bulanan dan efek liburan (dalam setiap arti kata) kadang-kadang spikey; dengan data lingkungan yang terkadang bisa Anda lakukan dengan baik dengan beberapa istilah Fourier (sinusoidal) dan tidak perlu menggunakan boneka.
Nick Cox
2
Terima kasih, @Nick Cox. Istilah Fourier tampaknya tidak menjadi solusi dalam kasus khusus saya, di mana variabel menunjukkan pola musiman yang lebih rumit daripada sinyal sinusoidal (kecuali saya menggunakan beberapa harmonik, tetapi ini tidak begitu menjadi tujuan di sini). Dan meskipun musiman jelas bukan istilah gangguan yang tidak menarik dalam kasus saya, saya lebih mencari sesuatu yang membantu saya untuk menjelaskan variabilitas ekstra dalam data di luar musiman (yaitu, tren jangka panjang) sebagai fungsi dari variabel lain.
ztl
4
Bagaimana dengan model ARMA multivarian? Ini mirip dengan VAR, tetapi jika saya mengerti dengan benar, memungkinkan interaksi yang lebih dinamis antara variabel. Orang lain mungkin bisa mengkonfirmasi / menolak kecurigaan saya.
rbatt

Jawaban:

1

Saya tahu pertanyaan ini sudah cukup lama tetapi masih belum terjawab. Mungkin pertanyaan utamanya bukanlah bagaimana menghapus siklus musiman dalam data tetapi merupakan bagian dari itu, jadi saya akan mencobanya: Untuk menghapus musiman dari kumpulan data ada beberapa metode, dari rata-rata agregat bulanan sederhana hingga pemasangan fungsi sinusoidal (atau harmonik lain yang sesuai) dengan metode pemasangan non-linear seperti Nelder-Mead.

Cara termudah adalah dengan rata-rata data milik semua Januari, semua Februari, dan seterusnya, yaitu, Anda membuat siklus tahunan gabungan, yang kemudian dapat Anda kurangi dari data Anda

nukimov
sumber