Apakah ada standar emas untuk pemodelan deret waktu yang tidak beraturan?

45

Di bidang ekonomi (saya pikir) kami memiliki ARIMA dan GARCH untuk deret waktu yang teratur dan Poisson, Hawkes untuk proses titik pemodelan, jadi bagaimana dengan upaya untuk pemodelan deret waktu yang tidak beraturan (tidak merata) - apakah ada (setidaknya) praktik umum ?

(Jika Anda memiliki pengetahuan dalam topik ini, Anda juga dapat memperluas artikel wiki yang sesuai .)

Edisi (tentang nilai yang hilang dan rangkaian waktu yang tidak beraturan):

Jawaban untuk komentar @Lucas Reis. Jika kesenjangan antara pengukuran atau variabel realisasi ditempatkan karena (misalnya) proses Poisson, tidak ada banyak ruang untuk jenis regularisasi ini, tetapi ada prosedur sederhana: t(i)apakah indeks waktu ke-i dari variabel x (waktu ke-i dari realisasi x), lalu tentukan kesenjangan antara waktu pengukuran sebagai g(i)=t(i)-t(i-1), kemudian kita diskritkan g(i)menggunakan konstanta c, dg(i)=floor(g(i)/cdan buat seri waktu baru dengan jumlah nilai kosong antara pengamatan lama dari seri waktu asli idan i+1sama dengan dg (i), tetapi masalahnya adalah bahwa ini prosedur dapat dengan mudah menghasilkan deret waktu dengan jumlah data yang hilang jauh lebih besar dari jumlah pengamatan, sehingga estimasi yang masuk akal dari nilai pengamatan yang hilang bisa menjadi mustahil dan terlalu besarchapus "struktur waktu / ketergantungan waktu, dll." masalah dianalisis (kasus ekstrim diberikan dengan mengambil c>=max(floor(g(i)/c))yang runtuh hanya seri waktu tidak beraturan menjadi spasi teratur

Edition2 (hanya untuk bersenang-senang): Penghitungan gambar untuk nilai yang hilang dalam deret waktu yang tidak beraturan atau bahkan proses poin.

Qbik
sumber
Hanya untuk memperjelas, ketika Anda mengatakan "spasi tidak teratur" Anda tidak bermaksud "spasi teratur tetapi dengan nilai yang hilang", bukan?
Wayne
2
Tidak :) t(i)- waktu, x[t(i)],x[t(i+1)],x[t(i+2)]...dan t(j+1)-t(j)tidak konstan. Data dikumpulkan dalam manor terdistribusi atau asinkron.
Qbik
2
Bagaimana dengan interpolasi dan melakukan analisis dengan nilai-nilai interpolasi, spasi teratur? Adakah yang tahu apa implikasi dari metode ini?
Lucas Reis
Bagaimana dengan memodelkan pertama kali poin, dan kemudian nilai poin, tergantung pada waktu mereka? Saya percaya bahwa 'proses titik yang ditandai' adalah istilahnya.
PeterR

Jawaban:

26

Jika pengamatan proses stokastik ditempatkan secara tidak teratur, cara paling alami untuk memodelkan pengamatan adalah pengamatan waktu terpisah dari proses waktu kontinu.

Apa yang secara umum diperlukan dari spesifikasi model adalah distribusi gabungan pengamatan diamati pada waktu , dan ini dapat, misalnya, dipecah menjadi distribusi bersyarat dari distribusi diberikan . Jika prosesnya adalah proses Markov, distribusi bersyarat ini bergantung pada bukan dan itu tergantung pada dan . Jika prosesnya homogen-waktu, ketergantungan pada titik waktu hanya melalui perbedaannya .X1,,Xnt1<t2<<tnXiXi1,,X1Xi1 Xi2,,X1 titi1titi1

Kita melihat dari ini bahwa jika kita memiliki pengamatan yang sama (dengan , katakanlah) dari proses Markov yang homogen waktu kita hanya perlu menentukan distribusi probabilitas bersyarat tunggal, , untuk menentukan model. Kalau tidak, kita perlu menentukan seluruh koleksi dari distribusi probabilitas bersyarat yang diindeks oleh perbedaan waktu pengamatan untuk menentukan model. Yang terakhir, pada kenyataannya, paling mudah dilakukan dengan menentukan suatu keluarga dari distribusi probabilitas bersyarat waktu kontinu.titi1=1P1Ptiti1Pt

Cara umum untuk mendapatkan spesifikasi model waktu kontinu adalah melalui persamaan diferensial stokastik (SDE) Tempat yang baik untuk memulai dengan melakukan statistik untuk model SDE adalah Simulasi dan Inferensi untuk Persamaan Diferensial Stokastik oleh Stefano Iacus. Mungkin banyak metode dan hasil yang dideskripsikan untuk pengamatan yang sama, tetapi ini biasanya hanya sesuai untuk presentasi dan tidak penting untuk aplikasi. Salah satu kendala utama adalah bahwa spesifikasi SDE jarang memungkinkan untuk kemungkinan eksplisit ketika Anda memiliki pengamatan terpisah, tetapi ada alternatif persamaan estimasi yang dikembangkan dengan baik.

dXt=a(Xt)dt+b(Xt)dBt.

Jika Anda ingin melampaui proses Markov, model volatilitas stokastik seperti (G) model ARCH mencoba memodelkan varians heterogen (volatilitas). Satu juga dapat mempertimbangkan penundaan persamaan seperti yang merupakan analog waktu kontinu dari proses AR . ( p )

dXt=0ta(s)(XtXs)ds+σdBt
(p)

Saya pikir itu adil untuk mengatakan bahwa praktik umum ketika berhadapan dengan pengamatan pada titik waktu tidak teratur adalah membangun model stokastik waktu terus menerus.

NRH
sumber
1
GARCH bukanlah proses volatilitas stokastik. Volume dalam GARCH sepenuhnya ditentukan untuk periode ini oleh pengamatan pada periode sebelumnya.
Aksakal
12

Untuk rangkaian waktu yang tidak beraturan, mudah untuk membuat filter Kalman .

Ada sebuah makalah tentang cara mentransfer ARIMA ke formulir ruang negara di sini

Dan satu makalah yang membandingkan Kalman dengan GARCH di sini(1)

(1) Choudhry, Taufiq dan Wu, Hao (2008)
Kemampuan peramalan metode filter GARCH vs Kalman: bukti dari beta harian Inggris yang bervariasi waktu.
Jurnal Peramalan , 27, (8), 670-689. (doi: 10.1002 / for.1096).

bdecaf
sumber
Maaf, saya tidak memiliki akses ke makalah terakhir itu, bisakah Anda membantu saya?
Kuarsa
2
Saya menambahkan kutipan sehingga sangat mudah untuk menemukan - ada juga preprint di sini: eprints.soton.ac.uk/147383
bdecaf
Makalah tentang mentransfer ARIMA ke ruang negara tampaknya memiliki tautan yang terputus.
ofey73
9

Ketika saya sedang mencari cara untuk mengukur jumlah fluktuasi dalam data sampel tidak teratur saya menemukan dua makalah ini tentang perataan eksponensial untuk data tidak teratur oleh Cipra [ 1 , 2 ]. Ini membangun lebih lanjut pada teknik smoothing dari Brown, Winters dan Holt (lihat entri Wikipedia untuk Exponential Smoothing ), dan pada metode lain oleh Wright (lihat kertas untuk referensi). Metode-metode ini tidak berasumsi banyak tentang proses yang mendasarinya dan juga bekerja untuk data yang menunjukkan fluktuasi musiman.

Saya tidak tahu apakah ada yang dianggap sebagai 'standar emas'. Untuk tujuan saya sendiri, saya memutuskan untuk menggunakan smoothing eksponensial dua arah (tunggal) mengikuti metode Brown. Saya mendapat ide untuk merapikan jalan membaca ringkasan ke kertas siswa (yang tidak dapat saya temukan sekarang).

Ivana
sumber
7

Analisis deret waktu yang tidak teratur dapat menjadi rumit, karena tidak banyak alat yang tersedia. Terkadang praktiknya adalah menerapkan algoritma reguler dan berharap yang terbaik. Ini belum tentu pendekatan terbaik. Di lain waktu orang mencoba untuk menginterpolasi data dalam kesenjangan. Saya bahkan telah melihat kasus di mana kesenjangan diisi dengan angka acak yang memiliki distribusi yang sama dengan data yang diketahui. Salah satu algoritma khusus untuk seri sampel yang tidak teratur adalah Lomb-Scargle Periodogram yang memberikan periodogram (think power spectrum) untuk seri waktu yang tidak rata sampel. Lomb-Scargle tidak memerlukan "pengkondisian celah".

cwkulp
sumber
3

Jika Anda menginginkan model domain-waktu "lokal" - yang bertentangan dengan memperkirakan fungsi korelasi atau spektrum daya), katakan untuk mendeteksi dan mengkarakterisasi pulsa sementara, lompatan, dan sejenisnya - maka algoritma Bayesian Block mungkin berguna. Ini memberikan representasi konstan rangkaian waktu optimal dalam mode data apa pun dan dengan sampling spasi acak (tidak merata). Lihat

"Studi dalam Analisis Rangkaian Waktu Astronomi. VI. Representasi Blok Bayesian," Scargle, Jeffrey D .; Norris, Jay P .; Jackson, Brad; Chiang, James, Jurnal Astrofisika, Volume 764, 167, 26 hal. (2013). http://arxiv.org/abs/1207.5578

Jeff Scargle
sumber
2

RJMartin, "Sinyal sampel tidak teratur: Teori dan Teknik untuk Analisis", tesis PhD, UCL, 1998, tersedia online. Bab 4 membahas model autoregresif dan mengembangkan subjek dari perspektif waktu kontinu, seperti yang dikatakan oleh posting lain.

Richard Martin
sumber
1

Bagian 4.10 dari J.Durbin, SJKoopman, Analisis Rangkaian Waktu oleh State Space Methods , edisi ke-2, 2012, dikhususkan untuk pemodelan dalam keadaan pengamatan yang hilang.

Jan Galkowski
sumber
1

Dalam analisis data spasial data sebagian besar waktu diambil sampelnya secara tidak teratur di ruang angkasa. Jadi satu ide adalah untuk melihat apa yang dilakukan di sana, dan mengimplementasikan estimasi variogram, kriging, dan seterusnya untuk domain "waktu" satu dimensi. Variograms bisa menarik bahkan untuk data deret waktu secara berkala, karena memiliki sifat yang berbeda dari fungsi autokorelasi, dan didefinisikan dan bermakna bahkan untuk data non-stasioner.

Berikut ini adalah salah satu kertas (di Spanyol) dan di sini satu sama lain.

kjetil b halvorsen
sumber