Apakah valid untuk mengagregasi deret waktu agar terlihat lebih bermakna?

10

Pertanyaan lain tentang deret waktu dari saya.

Saya memiliki dataset yang memberikan catatan harian tentang insiden kekerasan di rumah sakit jiwa selama tiga tahun. Dengan bantuan dari pertanyaan saya sebelumnya, saya telah mengotak-atiknya dan sekarang saya sedikit lebih bahagia.

Yang saya miliki sekarang adalah bahwa seri hariannya sangat bising. Ini berfluktuasi liar, naik dan turun, dari 0 kali hingga 20. Menggunakan paket loess dan paket perkiraan (yang saya bisa sangat merekomendasikan untuk pemula seperti saya) Saya hanya mendapatkan garis yang benar-benar datar, dengan interval kepercayaan besar dari perkiraan.

Namun, menggabungkan data mingguan atau bulanan lebih masuk akal. Mereka menyapu dari awal seri, dan kemudian meningkat lagi di tengah. Plot Loess dan paket ramalan keduanya menghasilkan sesuatu yang terlihat jauh lebih bermakna.

Rasanya agak seperti curang. Apakah saya lebih suka versi gabungan karena mereka terlihat bagus tanpa validitas nyata?

Atau akan lebih baik untuk menghitung rata-rata bergerak dan menggunakannya sebagai dasar? Saya khawatir saya tidak mengerti teori di balik semua ini dengan cukup baik untuk percaya diri tentang apa yang dapat diterima

Chris Beeley
sumber

Jawaban:

8

Ini sepenuhnya tergantung pada seri waktu Anda dan efek apa yang ingin Anda temukan / buktikan dll.

Yang penting di sini adalah, periode apa yang Anda miliki dalam data Anda. Buat spektrum data Anda dan lihat frekuensi apa yang umum dalam data Anda.

Lagi pula, Anda tidak berbohong ketika Anda memutuskan untuk menampilkan nilai agregat. Ketika Anda mencari efek yang terjadi selama beberapa minggu (seperti, lebih banyak kekerasan di musim panas ketika cuaca panas) itu adalah hal yang benar untuk dilakukan.

Mungkin Anda juga bisa melihat Hilbert Huang Transform. Ini akan memberi Anda Fungsi Mode Intrinsik yang sangat berguna untuk analisis visual.

Peter Smit
sumber
12

Sangat umum dalam memperkirakan data agregat untuk meningkatkan rasio sinyal / noise. Ada beberapa makalah tentang pengaruh agregasi temporal pada akurasi perkiraan di bidang ekonomi, misalnya. Apa yang mungkin Anda lihat dalam data harian adalah sinyal lemah yang dibanjiri oleh noise, sedangkan data mingguan dan bulanan menunjukkan sinyal kuat yang lebih terlihat.

Apakah Anda ingin menggunakan agregasi temporal sepenuhnya tergantung pada apa tujuan Anda. Jika Anda membutuhkan perkiraan insiden harian, maka agregasi tidak akan banyak berguna. Jika Anda tertarik untuk mengeksplorasi efek dari beberapa kovariat pada frekuensi kejadian, dan semua data Anda tersedia setiap hari, maka saya mungkin akan menggunakan data harian karena akan memberikan ukuran sampel yang lebih besar dan mungkin memungkinkan Anda untuk mendeteksi efeknya lebih mudah.

Karena Anda menggunakan paket prakiraan, mungkin Anda tertarik dengan peramalan seri waktu. Jadi, apakah Anda memerlukan ramalan harian, ramalan mingguan atau ramalan bulanan? Jawabannya akan menentukan apakah agregasi cocok untuk Anda.

Rob Hyndman
sumber
1

Masalah (dilema) yang Anda hadapi tampaknya menjadi masalah dalam memilih interval pengambilan sampel yang optimal (atau yang baik) untuk merevisi perkiraan Anda. Untuk mulai dengan, lihat tautan teks dari buku terkenal Brown, yang juga akan memenuhi syarat sebagai referensi yang bagus. Itu semua bermuara pada "menyeimbangkan risiko tidak memperhatikan perubahan dengan cepat terhadap variabilitas yang melekat dari data dan biaya merevisi rencana sering". Jika Anda tidak siap untuk merevisi perkiraan Anda (dan keputusan yang memotivasi itu) setiap hari, Anda tidak benar-benar perlu menggunakan data harian (paling berisik). Poin penting, sering hilang dalam literatur peramalan kontemporer, adalah bahwa ramalan hanya diperlukan untuk membantu membuat keputusan (kecuali orang juga tahu bagaimana cara mendapatkan kesenangan dari mereka).

Hibernasi
sumber