Apakah ada perbedaan antara time-series autocorrelated time dan kesalahan autocorrelated serial?

9

Saya cukup yakin bahwa saya kehilangan sesuatu yang jelas di sini, tetapi saya agak bingung dengan istilah yang berbeda di bidang seri waktu. Jika saya memahaminya dengan benar, kesalahan autokorelasi seri adalah masalah dalam model regresi (lihat contoh di sini ). Pertanyaan saya sekarang adalah apa sebenarnya yang mendefinisikan kesalahan yang terkait otomatis? Saya tahu definisi autokorelasi dan saya bisa menerapkan rumus, tetapi ini lebih merupakan masalah pemahaman dengan deret waktu dalam regresi.

Sebagai contoh, mari kita ambil rangkaian waktu suhu harian: Jika hari ini hari yang panas (waktu musim panas!), Mungkin besok juga panas, dan sebaliknya. Saya kira saya memiliki masalah untuk menyebut fenomena ini sebagai fenomena "kesalahan autokorelasi seriial" karena itu tidak mengejutkan saya sebagai kesalahan, tetapi sebagai sesuatu yang diharapkan.

Secara lebih formal, mari kita asumsikan regresi dengan satu variabel dependen dan satu variabel independen x_t dan model.ytxt

yt=α+βxt+ϵt

Apakah mungkin bahwa xt , sedangkan ϵt adalah iid? Jika demikian, apa artinya itu untuk semua metode yang menyesuaikan kesalahan standar untuk autokorelasi? Apakah Anda masih harus melakukan itu atau hanya berlaku untuk kesalahan terkait otomatis? Atau apakah Anda akan selalu memodelkan autokorelasi dalam pengaturan seperti itu dalam istilah kesalahan, sehingga pada dasarnya tidak ada bedanya jika xt atau et ?

Ini pertanyaan pertamaku di sini. Saya harap ini tidak terlalu membingungkan dan saya harap saya tidak melewatkan sesuatu yang jelas ... Saya juga mencoba untuk google dan menemukan beberapa tautan yang menarik (misalnya, di sini di SA ), tetapi tidak ada yang benar-benar membantu saya.

Christoph_J
sumber

Jawaban:

7

Sepertinya saya bahwa Anda terjebak pada perbedaan antara autoregresi (suhu hari ini dipengaruhi oleh suhu kemarin, atau konsumsi heroin saya hari ini tergantung pada penggunaan narkoba saya sebelumnya) dan kesalahan autokorelasi (yang ada hubungannya dengan off-diagonal istilah dalam istilah varians-kovarians untukϵmenjadi tidak nol. Tetap dengan contoh cuaca Anda, misalkan Anda memodelkan suhu sebagai fungsi waktu, tetapi juga dipengaruhi oleh hal-hal seperti letusan gunung berapi, yang Anda tinggalkan dari model Anda. Gunung berapi mengirimkan awan debu, yang menghalangi matahari, menurunkan suhu. Gangguan acak ini akan bertahan selama lebih dari satu periode. Ini akan membuat tren waktu Anda tampak kurang curam dari yang seharusnya. Agar adil, ini mungkin merupakan kasus bahwa autoregresi dan kesalahan autokorelasi merupakan masalah dengan suhu.

Kesalahan autokorelasi juga dapat muncul dalam data spasial cross-sectional, di mana guncangan acak yang mempengaruhi aktivitas ekonomi di satu wilayah akan meluas ke daerah lain karena mereka memiliki ikatan ekonomi. Sebuah kejutan yang membunuh anggur di California juga akan menurunkan penjualan daging sapi dari Montana. Anda juga dapat menyebabkan gangguan autokorelasi jika Anda menghilangkan variabel independen yang relevan dan autokorelasi dari model deret waktu Anda.

Dimitriy V. Masterov
sumber
Terima kasih banyak, Dimitriy. Anda benar: Saya bingung tentang perbedaan antara autoregresi dan kesalahan autokorelasi. Hanya untuk memastikan, dalam contoh saya, saya akan memodelkan sebagai rangkaian waktu autoregresif (abstrak dari letusan gunung berapi, dll.) Karena musim panas dan musim dingin dan kemudian tidak akan harus berurusan dengan kesalahan yang terkait otomatis? xt
Christoph_J
1
@Christoph_J Idealnya Anda ingin mundur satu kali lebih lama untuk pola musiman dan aktivitas vulkanik. Jika sebaliknya kami mengabaikan penyebab kesalahan autokorelasi, model rata-rata bergerak dapat membantu. Dalam hal ini akan menjadi model ARIMA.
Robert Kubrick
1
@Christoph_J Saya tidak yakin saya mengerti pertanyaan Anda. Apakah Anda bermaksud menulis atas? Anda juga harus memberi tahu kami lebih banyak tentang masalah aktual yang Anda hadapi. Contoh suhu saya hanyalah model mainan untuk menyoroti masalah. Ada beberapa solusi untuk berurusan dengan AR, yang termudah di antaranya adalah spesifikasi lag terdistribusi Koyck, yang bermuara pada estimasi persamaan sederhana dengan istilah kesalahan . Namun, Anda tetap harus melakukan semacam uji autokorelasi, seperti Durbin-Watson, meskipun itu dapat memberi Anda false positive jika Anda tidak mendapatkan spesifikasi yang benar. ytMA(1)
Dimitriy V. Masterov
Terima kasih untuk kalian berdua. @ DimitriyV.Masterov Pada titik ini, saya tidak memiliki masalah yang sebenarnya. Itulah alasan saya mencoba membingkai masalah saya secara umum. Saya pikir saya hanya berjuang dengan deret waktu di satu sisi dan regresi di sisi lain. Terkadang mereka tampak sebagai dua masalah yang sangat berbeda; jika saya melakukannya dengan benar ada kasus-kasus di mana Anda hanya mencoba untuk memodelkan deret waktu (berapa banyak kelambatan yang dimilikinya? apakah itu diam? dll.). Di sisi lain, kadang-kadang Anda sepertinya mengalami kemunduran pada deret waktu yang lain, tanpa memperhatikan fakta bahwa itu adalah TS.
Christoph_J
Dan kadang-kadang saya hanya memiliki beberapa masalah apa cara terbaik untuk maju: Apakah saya harus memodelkan proses autoregresif terlebih dahulu atau bisakah saya mengoreksi autokorelasi dalam hal kesalahan? Namun, sejauh pertanyaan saya prihatin, jawaban Anda dan Robert banyak membantu dan saya pikir di bidang saya (model faktor dalam keuangan) harus berurusan dengan kesalahan seri terkait otomatis, bukan dengan autoregresi. Jika pertanyaan lain muncul, saya akan mengajukan pertanyaan baru.
Christoph_J
4

Hanya menambahkan hingga Dimitriy jawaban yang sangat baik: kesalahan autokorelasi menimbulkan masalah untuk perhitungan koefisien standar kesalahan dan dengan demikian tingkat signifikansi, atau nilai-p, membuat pemilihan IVs kurang mudah. dan nilai F juga terpengaruh.R2

Dari semua asumsi dalam regresi linier (homoscedasticity, independensi residual, linieritas hubungan IVs -> DV, normalitas residual) linieritas dan independensi residual adalah yang berdampak pada hasil yang lebih serius jika dilanggar.

Robert Kubrick
sumber