Di bidang ekonomi (saya pikir) kami memiliki ARIMA dan GARCH untuk deret waktu yang teratur dan Poisson, Hawkes untuk proses titik pemodelan, jadi bagaimana dengan upaya untuk pemodelan deret waktu yang tidak beraturan (tidak merata) - apakah ada (setidaknya) praktik umum ?
(Jika Anda memiliki pengetahuan dalam topik ini, Anda juga dapat memperluas artikel wiki yang sesuai .)
Edisi (tentang nilai yang hilang dan rangkaian waktu yang tidak beraturan):
Jawaban untuk komentar @Lucas Reis. Jika kesenjangan antara pengukuran atau variabel realisasi ditempatkan karena (misalnya) proses Poisson, tidak ada banyak ruang untuk jenis regularisasi ini, tetapi ada prosedur sederhana: t(i)
apakah indeks waktu ke-i dari variabel x (waktu ke-i dari realisasi x), lalu tentukan kesenjangan antara waktu pengukuran sebagai g(i)=t(i)-t(i-1)
, kemudian kita diskritkan g(i)
menggunakan konstanta c
, dg(i)=floor(g(i)/c
dan buat seri waktu baru dengan jumlah nilai kosong antara pengamatan lama dari seri waktu asli i
dan i+1
sama dengan dg (i), tetapi masalahnya adalah bahwa ini prosedur dapat dengan mudah menghasilkan deret waktu dengan jumlah data yang hilang jauh lebih besar dari jumlah pengamatan, sehingga estimasi yang masuk akal dari nilai pengamatan yang hilang bisa menjadi mustahil dan terlalu besarc
hapus "struktur waktu / ketergantungan waktu, dll." masalah dianalisis (kasus ekstrim diberikan dengan mengambil c>=max(floor(g(i)/c))
yang runtuh hanya seri waktu tidak beraturan menjadi spasi teratur
Edition2 (hanya untuk bersenang-senang): Penghitungan gambar untuk nilai yang hilang dalam deret waktu yang tidak beraturan atau bahkan proses poin.
t(i)
- waktu,x[t(i)],x[t(i+1)],x[t(i+2)]...
dant(j+1)-t(j)
tidak konstan. Data dikumpulkan dalam manor terdistribusi atau asinkron.Jawaban:
Jika pengamatan proses stokastik ditempatkan secara tidak teratur, cara paling alami untuk memodelkan pengamatan adalah pengamatan waktu terpisah dari proses waktu kontinu.
Apa yang secara umum diperlukan dari spesifikasi model adalah distribusi gabungan pengamatan diamati pada waktu , dan ini dapat, misalnya, dipecah menjadi distribusi bersyarat dari distribusi diberikan . Jika prosesnya adalah proses Markov, distribusi bersyarat ini bergantung pada bukan dan itu tergantung pada dan . Jika prosesnya homogen-waktu, ketergantungan pada titik waktu hanya melalui perbedaannya .X1,…,Xn t1<t2<…<tn Xi Xi−1,…,X1 Xi−1 − Xi−2,…,X1 − ti ti−1 ti−ti−1
Kita melihat dari ini bahwa jika kita memiliki pengamatan yang sama (dengan , katakanlah) dari proses Markov yang homogen waktu kita hanya perlu menentukan distribusi probabilitas bersyarat tunggal, , untuk menentukan model. Kalau tidak, kita perlu menentukan seluruh koleksi dari distribusi probabilitas bersyarat yang diindeks oleh perbedaan waktu pengamatan untuk menentukan model. Yang terakhir, pada kenyataannya, paling mudah dilakukan dengan menentukan suatu keluarga dari distribusi probabilitas bersyarat waktu kontinu.ti−ti−1=1 P1 Pti−ti−1 Pt
Cara umum untuk mendapatkan spesifikasi model waktu kontinu adalah melalui persamaan diferensial stokastik (SDE) Tempat yang baik untuk memulai dengan melakukan statistik untuk model SDE adalah Simulasi dan Inferensi untuk Persamaan Diferensial Stokastik oleh Stefano Iacus. Mungkin banyak metode dan hasil yang dideskripsikan untuk pengamatan yang sama, tetapi ini biasanya hanya sesuai untuk presentasi dan tidak penting untuk aplikasi. Salah satu kendala utama adalah bahwa spesifikasi SDE jarang memungkinkan untuk kemungkinan eksplisit ketika Anda memiliki pengamatan terpisah, tetapi ada alternatif persamaan estimasi yang dikembangkan dengan baik.
Jika Anda ingin melampaui proses Markov, model volatilitas stokastik seperti (G) model ARCH mencoba memodelkan varians heterogen (volatilitas). Satu juga dapat mempertimbangkan penundaan persamaan seperti yang merupakan analog waktu kontinu dari proses AR . ( p )
Saya pikir itu adil untuk mengatakan bahwa praktik umum ketika berhadapan dengan pengamatan pada titik waktu tidak teratur adalah membangun model stokastik waktu terus menerus.
sumber
Untuk rangkaian waktu yang tidak beraturan, mudah untuk membuat filter Kalman .
Ada sebuah makalah tentang cara mentransfer ARIMA ke formulir ruang negara di sini
Dan satu makalah yang membandingkan Kalman dengan GARCH di sini(1)
Kemampuan peramalan metode filter GARCH vs Kalman: bukti dari beta harian Inggris yang bervariasi waktu.
Jurnal Peramalan , 27, (8), 670-689. (doi: 10.1002 / for.1096).
sumber
Ketika saya sedang mencari cara untuk mengukur jumlah fluktuasi dalam data sampel tidak teratur saya menemukan dua makalah ini tentang perataan eksponensial untuk data tidak teratur oleh Cipra [ 1 , 2 ]. Ini membangun lebih lanjut pada teknik smoothing dari Brown, Winters dan Holt (lihat entri Wikipedia untuk Exponential Smoothing ), dan pada metode lain oleh Wright (lihat kertas untuk referensi). Metode-metode ini tidak berasumsi banyak tentang proses yang mendasarinya dan juga bekerja untuk data yang menunjukkan fluktuasi musiman.
Saya tidak tahu apakah ada yang dianggap sebagai 'standar emas'. Untuk tujuan saya sendiri, saya memutuskan untuk menggunakan smoothing eksponensial dua arah (tunggal) mengikuti metode Brown. Saya mendapat ide untuk merapikan jalan membaca ringkasan ke kertas siswa (yang tidak dapat saya temukan sekarang).
sumber
Analisis deret waktu yang tidak teratur dapat menjadi rumit, karena tidak banyak alat yang tersedia. Terkadang praktiknya adalah menerapkan algoritma reguler dan berharap yang terbaik. Ini belum tentu pendekatan terbaik. Di lain waktu orang mencoba untuk menginterpolasi data dalam kesenjangan. Saya bahkan telah melihat kasus di mana kesenjangan diisi dengan angka acak yang memiliki distribusi yang sama dengan data yang diketahui. Salah satu algoritma khusus untuk seri sampel yang tidak teratur adalah Lomb-Scargle Periodogram yang memberikan periodogram (think power spectrum) untuk seri waktu yang tidak rata sampel. Lomb-Scargle tidak memerlukan "pengkondisian celah".
sumber
Jika Anda menginginkan model domain-waktu "lokal" - yang bertentangan dengan memperkirakan fungsi korelasi atau spektrum daya), katakan untuk mendeteksi dan mengkarakterisasi pulsa sementara, lompatan, dan sejenisnya - maka algoritma Bayesian Block mungkin berguna. Ini memberikan representasi konstan rangkaian waktu optimal dalam mode data apa pun dan dengan sampling spasi acak (tidak merata). Lihat
"Studi dalam Analisis Rangkaian Waktu Astronomi. VI. Representasi Blok Bayesian," Scargle, Jeffrey D .; Norris, Jay P .; Jackson, Brad; Chiang, James, Jurnal Astrofisika, Volume 764, 167, 26 hal. (2013). http://arxiv.org/abs/1207.5578
sumber
RJMartin, "Sinyal sampel tidak teratur: Teori dan Teknik untuk Analisis", tesis PhD, UCL, 1998, tersedia online. Bab 4 membahas model autoregresif dan mengembangkan subjek dari perspektif waktu kontinu, seperti yang dikatakan oleh posting lain.
sumber
Bagian 4.10 dari J.Durbin, SJKoopman, Analisis Rangkaian Waktu oleh State Space Methods , edisi ke-2, 2012, dikhususkan untuk pemodelan dalam keadaan pengamatan yang hilang.
sumber
Dalam analisis data spasial data sebagian besar waktu diambil sampelnya secara tidak teratur di ruang angkasa. Jadi satu ide adalah untuk melihat apa yang dilakukan di sana, dan mengimplementasikan estimasi variogram, kriging, dan seterusnya untuk domain "waktu" satu dimensi. Variograms bisa menarik bahkan untuk data deret waktu secara berkala, karena memiliki sifat yang berbeda dari fungsi autokorelasi, dan didefinisikan dan bermakna bahkan untuk data non-stasioner.
Berikut ini adalah salah satu kertas (di Spanyol) dan di sini satu sama lain.
sumber