Bagaimana cara memprediksi kapan peristiwa berikutnya terjadi, berdasarkan waktu kejadian sebelumnya?

19

Saya seorang siswa sekolah menengah dan saya sedang mengerjakan proyek pemrograman komputer, tetapi saya tidak memiliki banyak pengalaman dalam statistik dan pemodelan data di luar kursus statistik SMA, jadi saya agak bingung.

Pada dasarnya, saya memiliki daftar yang cukup besar (anggap itu cukup besar untuk memenuhi asumsi untuk setiap tes atau tindakan statistik) dari waktu seseorang memutuskan untuk mencetak dokumen. Berdasarkan daftar ini, saya ingin membuat model statistik dari beberapa jenis yang akan memprediksi waktu yang paling mungkin untuk pekerjaan cetak berikutnya mengingat semua waktu acara sebelumnya.

Saya sudah membaca ini , tetapi tanggapannya tidak benar-benar membantu dengan apa yang ada dalam pikiran saya untuk proyek saya. Saya melakukan beberapa riset tambahan dan menemukan bahwa Model Markov Tersembunyi kemungkinan akan memungkinkan saya untuk melakukannya secara akurat, tetapi saya tidak dapat menemukan tautan tentang cara membuat Model Markov Tersembunyi hanya dengan menggunakan daftar waktu. Saya juga menemukan bahwa menggunakan filter Kalman pada daftar mungkin berguna tetapi pada dasarnya, saya ingin mendapatkan lebih banyak informasi tentang itu dari seseorang yang benar-benar menggunakannya dan mengetahui keterbatasan dan persyaratan mereka sebelum hanya mencoba sesuatu dan berharap itu berfungsi.

Terima kasih banyak!

ankushg
sumber
1
+1 Ini adalah pertanyaan yang diartikulasikan dengan baik, Ankush. Saya harap Anda mendapatkan respons yang bagus. Selamat datang di situs kami!
whuber
Terima kasih telah memperbaiki judulnya - Saya menggerakkan kata-kata untuk mencoba membuat hal-hal lebih koheren dan saya kira saya akhirnya membuatnya tidak masuk akal sama sekali! Semoga seseorang dengan pengetahuan yang sesuai dapat membantu.
ankushg

Jawaban:

10

Model Hidden Markov akan berlaku jika data adalah emisi acak dari beberapa model Markov yang tidak diamati; Saya tidak akan mengesampingkan hal itu, tetapi sepertinya itu bukan model yang sangat alami.

Saya akan berpikir tentang proses poin , yang cocok dengan data khusus Anda dengan baik. Ada banyak pekerjaan untuk memprediksi gempa bumi (walaupun saya tidak tahu banyak tentang itu) dan bahkan kejahatan .

Jika ada banyak orang yang berbeda mencetak, dan Anda hanya melihat waktu tetapi bukan identitas individu, proses Poisson mungkin bekerja dengan baik (superposisi dari beberapa proses titik independen adalah sekitar Poisson), meskipun itu harus tidak homogen (yang kemungkinan titik bervariasi dari waktu ke waktu): orang lebih kecil kemungkinannya untuk mencetak pada jam 3 pagi daripada jam 3 sore.

Untuk model proses Poisson yang tidak homogen , kuncinya adalah mendapatkan perkiraan yang baik tentang peluang pekerjaan cetak pada waktu tertentu pada hari tertentu.

Namun, jika waktu cetak ini untuk siswa di kelas, itu bisa sangat rumit, karena mereka tidak mungkin mandiri dan sehingga proses Poisson tidak akan bekerja dengan baik.

Berikut ini tautan ke makalah tentang aplikasi kejahatan.

Karl
sumber
Terima kasih untuk ini. Apakah Anda tahu cara untuk membuat model untuk proses poin? Tampaknya menjadi yang paling relevan, tetapi saya tidak berpengalaman dalam statistik sehingga semuanya tampak membingungkan (Poisson vs Determinantal vs Cox?) Ketika saya membaca wikipedia ...: - \
ankushg
@ Tidak - Saya akan mulai dengan membuat beberapa plot data. Berapa lama daftar waktu cetak ini?
Karl
Ini tentang data setahun. Saya akan membuat beberapa plot dan memberi tahu Anda bagaimana hasilnya.
ankushg
1

Berdasarkan pada prediksi kemungkinan waktu menggunakan statistik pemindaian Bayesian multivariat (MBSS) dapat membantu. MBSS ini memiliki keuntungan meningkatkan ketepatan waktu dan akurasi deteksi peristiwa.

Esan
sumber
Selamat datang di situs ini, @Esan. Bisakah Anda mengatakan lebih banyak tentang MBSS, bagaimana cara kerjanya, dan bagaimana itu akan membantu?
gung - Reinstate Monica