Generalized Linear Models vs Timseries models untuk peramalan

10

Apa perbedaan dalam menggunakan Generalized Linear Model, seperti Automatic Relevance Determination (ARD) dan regresi Ridge, dibandingkan model Time series seperti Box-Jenkins (ARIMA) atau smoothing eksponensial untuk peramalan? Apakah ada aturan praktis kapan menggunakan GLM dan kapan menggunakan Time Series?

ccsv
sumber
2
Regresi Ridge bukan model linier umum. Penambahan penalti menjadikannya penaksir minimal. Ini adalah modifikasi dari GLM. Secara umum, bagaimanapun, GLM tidak menggunakan memanfaatkan struktur kovarian autoregresif, tetapi mungkin termasuk efek tetap tertinggal. L2
AdamO
GLM tidak memperkirakan tren, musim, dan siklus. ARIMA melakukannya.
henryjhu

Jawaban:

2

Tidak benar-benar ahli tetapi pertanyaan ini belum terjawab untuk sementara waktu, jadi saya akan mencoba jawaban: Saya dapat memikirkan 3 perbedaan antara model GLM dan Time series a Box dan Jenkins:

1) GLMs lebih untuk memodelkan variabel Y sebagai fungsi dari beberapa variabel X lainnya (Y = f (X)). Dalam model deret waktu Anda (kebanyakan?) Memodelkan variabel Y sebagai fungsi dari dirinya sendiri, tetapi dari langkah waktu sebelumnya (Y (t) = f (Y (t-1), Y (t-2), ...) );

2) Terkait dengan poin sebelumnya: GLM tidak mempertimbangkan autokorelasi per kovariat input, sedangkan model deret waktu seperti ARIMA bersifat auto-korelatif;

3) Saya pikir model auto-regresif didasarkan pada asumsi bahwa residual normal dengan rata-rata nol, sedangkan GLM menerima struktur data yang lebih kompleks dari variabel respon, mungkin memiliki distribusi non-normal (Gamma, Poisson, dll).

Apakah ada aturan kapan menggunakan GLM dan kapan menggunakan Time Series? Kecuali jika Anda mempertimbangkan dalam waktu model Anda sebagai efek acak, saya pikir GLM hanyalah pendekatan yang salah untuk model seri waktu.

nukimov
sumber
Komentar Anda 1) sama sekali tidak benar, Model Time Series (model Box & Jenkins) menyertakan model ARMAX alias Model Fungsi Transfer yang dapat memasukkan input (seri prediktor) yang dapat menggunakan prediktor yang ditentukan pengguna dan struktur deterministik laten (seperti pulsa, langkah / pergeseran level, pulsa musiman tren waktu setempat) menunggu untuk diidentifikasi. Lihat stats.stackexchange.com/search?q=user%3A3382+transfer+Function+ untuk diskusi lebih lanjut
IrishStat
Komentar ini tidak semuanya benar. Model linier umum dapat menjelaskan korelasi-otomatis dalam istilah kesalahan.
lzstat