Menggunakan analisis deret waktu untuk menganalisis / memprediksi perilaku kekerasan

13

Ini sedikit pertanyaan yang sembrono, tetapi saya memiliki minat serius pada jawabannya. Saya bekerja di rumah sakit jiwa dan saya memiliki data tiga tahun, dikumpulkan setiap hari di setiap bangsal mengenai tingkat kekerasan di bangsal itu.

Jelas model yang cocok dengan data ini adalah model deret waktu. Saya harus membedakan skor untuk membuatnya lebih normal. Saya cocok dengan model ARMA dengan data yang dibedakan, dan yang paling cocok menurut saya adalah model dengan satu derajat pembedaan dan orde pertama korelasi otomatis pada lag 2.

Pertanyaan saya adalah, untuk apa saya bisa menggunakan model ini? Rangkaian waktu selalu tampak sangat berguna di buku teks ketika itu tentang populasi kelinci dan harga minyak, tapi sekarang saya sudah melakukan sendiri hasilnya tampak sangat abstrak sehingga sepenuhnya buram. Skor yang berbeda berkorelasi satu sama lain pada jeda dua, tetapi saya tidak bisa benar-benar menyarankan semua orang untuk waspada tinggi dua hari setelah insiden serius dalam semua keseriusan.

Atau bisakah saya?

Chris Beeley
sumber
bisakah Anda mengedit judul menjadi sesuatu seperti "Menggunakan analisis deret waktu untuk menganalisis / memprediksi perilaku kekerasan"?
Paul
1
Saya sangat suka jenis pertanyaan ini, saya pikir jenis masalah dunia nyata yang tepat akan meningkatkan minat situs. Akan lebih baik jika Anda memiliki kemungkinan untuk menambahkan tautan ke data, atau memberi tahu kami (sebagai pelengkap posting) apa yang akhirnya Anda lakukan, apa kesimpulannya .... namun saya mengerti bahwa ini bisa menjadi rahasia ...
robin girard
Saya berharap saya bisa memberikan suara lagi untuk membuat Anda melewati pertanyaan tentang definisi variabel acak;)
robin girard
Saya akan kembali untuk memberi tahu Anda apa hasilnya, tetapi itu akan sementara karena saya sedang mengerjakannya bersama banyak tugas lainnya. Tidak yakin apa yang Anda maksud tentang "melewatkan pertanyaan tentang variabel acak"? Apakah ada pertanyaan yang Anda rekomendasikan?
Chris Beeley
maaf jika saya tidak jelas, maksud saya bukankah saya lebih suka (pendapat subyektif pribadi) pertanyaan seperti milik Anda daripada pertanyaan yang menanyakan "apa itu variabel acak" ... tapi saya rasa kesenangan saya bukan milik semua orang :)
robin girard

Jawaban:

9

Model yang sesuai dengan data tidak harus berupa model deret waktu; Saya akan menyarankan sedikit berpikir di luar kotak.

Jika Anda memiliki banyak variabel (misalnya usia, jenis kelamin, diet, etnis, penyakit, obat-obatan) Anda dapat menggunakannya untuk model yang berbeda. Mungkin memiliki pasien tertentu di ruangan yang sama merupakan prediktor penting? Atau mungkin itu ada hubungannya dengan staf yang hadir? Atau pertimbangkan untuk menggunakan model deret waktu multi-variate (misalnya VECM) jika Anda memiliki variabel lain yang dapat Anda gunakan. Lihatlah hubungan antara kekerasan antar pasien: apakah pasien tertentu bertindak bersama?

Model deret waktu berguna jika waktu memiliki peran penting dalam perilaku. Misalnya, mungkin ada sekelompok kekerasan. Lihatlah literatur pengelompokan volatilitas. Seperti yang disarankan @Jonas, dengan jeda urutan 2, Anda mungkin harus waspada pada hari berikutnya setelah ledakan kekerasan. Tetapi itu tidak membantu Anda mencegah hari pertama: mungkin ada informasi lain yang dapat Anda tautkan ke dalam analisis untuk benar-benar mengerti penyebab kekerasan, daripada sekadar meramalkannya dengan cara deret waktu.

Terakhir, sebagai saran teknis: jika Anda menggunakan R untuk analisis, Anda mungkin melihat paket ramalan dari Rob Hyndman (pembuat situs ini). Ini memiliki banyak fitur yang sangat bagus; lihat makalah "Perkiraan Seri Waktu Otomatis: Paket perkiraan untuk R" dalam Journal of Statistical Software.

Shane
sumber
1
Setuju - hanya untuk membuang beberapa ide tambahan pada pemodelan: logistik untuk memprediksi pasien mana yang akan memiliki 1+ ledakan kekerasan, regresi Poisson (esque) untuk memprediksi pasien mana yang akan memiliki banyak ledakan, multilevel untuk memeriksa variasi dari kamar ke kamar dan / atau bangsal ke bangsal ...
Matt Parker
1
+1 Sangat mudah untuk dibutakan oleh nasihat untuk tidak menggunakan model linier, dll, pada deret waktu karena masalah korelasi otomatis, dan terjebak dalam ARIMA, DLM, dll, ketika LM, GLM, dll bisa sangat kuat dengan sedikit hati-hati.
Wayne
6

Anda mencocokkan model dengan perbedaan, yang berarti Anda menggambarkan perubahan tingkat kekerasan. Anda mendapat jeda 2 hari. Kelambatan merupakan indikasi dari memori proses. Dengan kata lain, perubahan tingkat kekerasan saat ini memiliki ketergantungan pada perubahan tingkat kekerasan dalam dua hari terakhir. Untuk skala waktu yang lebih lama, kontribusi pengaruh acak menjadi cukup kuat sehingga tidak ada kaitan yang jelas lagi.

Apakah korelasi otomatis positif? Kemudian perubahan tingkat kekerasan hari ini menunjukkan perubahan serupa dalam tingkat kekerasan dalam dua hari. Apakah ini negatif? Maka kekerasan bisa tetap lebih tinggi selama dua hari.

Tentu saja, Anda mungkin ingin harus mengendalikan efek pengganggu. Misalnya, setelah insiden serius, orang mungkin lebih mungkin melaporkan insiden kecil, tetapi "kepekaan" ini akan hilang setelah dua hari.

Jonas
sumber