Ini sedikit pertanyaan yang sembrono, tetapi saya memiliki minat serius pada jawabannya. Saya bekerja di rumah sakit jiwa dan saya memiliki data tiga tahun, dikumpulkan setiap hari di setiap bangsal mengenai tingkat kekerasan di bangsal itu.
Jelas model yang cocok dengan data ini adalah model deret waktu. Saya harus membedakan skor untuk membuatnya lebih normal. Saya cocok dengan model ARMA dengan data yang dibedakan, dan yang paling cocok menurut saya adalah model dengan satu derajat pembedaan dan orde pertama korelasi otomatis pada lag 2.
Pertanyaan saya adalah, untuk apa saya bisa menggunakan model ini? Rangkaian waktu selalu tampak sangat berguna di buku teks ketika itu tentang populasi kelinci dan harga minyak, tapi sekarang saya sudah melakukan sendiri hasilnya tampak sangat abstrak sehingga sepenuhnya buram. Skor yang berbeda berkorelasi satu sama lain pada jeda dua, tetapi saya tidak bisa benar-benar menyarankan semua orang untuk waspada tinggi dua hari setelah insiden serius dalam semua keseriusan.
Atau bisakah saya?
sumber
Jawaban:
Model yang sesuai dengan data tidak harus berupa model deret waktu; Saya akan menyarankan sedikit berpikir di luar kotak.
Jika Anda memiliki banyak variabel (misalnya usia, jenis kelamin, diet, etnis, penyakit, obat-obatan) Anda dapat menggunakannya untuk model yang berbeda. Mungkin memiliki pasien tertentu di ruangan yang sama merupakan prediktor penting? Atau mungkin itu ada hubungannya dengan staf yang hadir? Atau pertimbangkan untuk menggunakan model deret waktu multi-variate (misalnya VECM) jika Anda memiliki variabel lain yang dapat Anda gunakan. Lihatlah hubungan antara kekerasan antar pasien: apakah pasien tertentu bertindak bersama?
Model deret waktu berguna jika waktu memiliki peran penting dalam perilaku. Misalnya, mungkin ada sekelompok kekerasan. Lihatlah literatur pengelompokan volatilitas. Seperti yang disarankan @Jonas, dengan jeda urutan 2, Anda mungkin harus waspada pada hari berikutnya setelah ledakan kekerasan. Tetapi itu tidak membantu Anda mencegah hari pertama: mungkin ada informasi lain yang dapat Anda tautkan ke dalam analisis untuk benar-benar mengerti penyebab kekerasan, daripada sekadar meramalkannya dengan cara deret waktu.
Terakhir, sebagai saran teknis: jika Anda menggunakan R untuk analisis, Anda mungkin melihat paket ramalan dari Rob Hyndman (pembuat situs ini). Ini memiliki banyak fitur yang sangat bagus; lihat makalah "Perkiraan Seri Waktu Otomatis: Paket perkiraan untuk R" dalam Journal of Statistical Software.
sumber
Anda mencocokkan model dengan perbedaan, yang berarti Anda menggambarkan perubahan tingkat kekerasan. Anda mendapat jeda 2 hari. Kelambatan merupakan indikasi dari memori proses. Dengan kata lain, perubahan tingkat kekerasan saat ini memiliki ketergantungan pada perubahan tingkat kekerasan dalam dua hari terakhir. Untuk skala waktu yang lebih lama, kontribusi pengaruh acak menjadi cukup kuat sehingga tidak ada kaitan yang jelas lagi.
Apakah korelasi otomatis positif? Kemudian perubahan tingkat kekerasan hari ini menunjukkan perubahan serupa dalam tingkat kekerasan dalam dua hari. Apakah ini negatif? Maka kekerasan bisa tetap lebih tinggi selama dua hari.
Tentu saja, Anda mungkin ingin harus mengendalikan efek pengganggu. Misalnya, setelah insiden serius, orang mungkin lebih mungkin melaporkan insiden kecil, tetapi "kepekaan" ini akan hilang setelah dua hari.
sumber