Saya seorang siswa sekolah menengah dan saya sedang mengerjakan proyek pemrograman komputer, tetapi saya tidak memiliki banyak pengalaman dalam statistik dan pemodelan data di luar kursus statistik SMA, jadi saya agak bingung.
Pada dasarnya, saya memiliki daftar yang cukup besar (anggap itu cukup besar untuk memenuhi asumsi untuk setiap tes atau tindakan statistik) dari waktu seseorang memutuskan untuk mencetak dokumen. Berdasarkan daftar ini, saya ingin membuat model statistik dari beberapa jenis yang akan memprediksi waktu yang paling mungkin untuk pekerjaan cetak berikutnya mengingat semua waktu acara sebelumnya.
Saya sudah membaca ini , tetapi tanggapannya tidak benar-benar membantu dengan apa yang ada dalam pikiran saya untuk proyek saya. Saya melakukan beberapa riset tambahan dan menemukan bahwa Model Markov Tersembunyi kemungkinan akan memungkinkan saya untuk melakukannya secara akurat, tetapi saya tidak dapat menemukan tautan tentang cara membuat Model Markov Tersembunyi hanya dengan menggunakan daftar waktu. Saya juga menemukan bahwa menggunakan filter Kalman pada daftar mungkin berguna tetapi pada dasarnya, saya ingin mendapatkan lebih banyak informasi tentang itu dari seseorang yang benar-benar menggunakannya dan mengetahui keterbatasan dan persyaratan mereka sebelum hanya mencoba sesuatu dan berharap itu berfungsi.
Terima kasih banyak!
Jawaban:
Model Hidden Markov akan berlaku jika data adalah emisi acak dari beberapa model Markov yang tidak diamati; Saya tidak akan mengesampingkan hal itu, tetapi sepertinya itu bukan model yang sangat alami.
Saya akan berpikir tentang proses poin , yang cocok dengan data khusus Anda dengan baik. Ada banyak pekerjaan untuk memprediksi gempa bumi (walaupun saya tidak tahu banyak tentang itu) dan bahkan kejahatan .
Jika ada banyak orang yang berbeda mencetak, dan Anda hanya melihat waktu tetapi bukan identitas individu, proses Poisson mungkin bekerja dengan baik (superposisi dari beberapa proses titik independen adalah sekitar Poisson), meskipun itu harus tidak homogen (yang kemungkinan titik bervariasi dari waktu ke waktu): orang lebih kecil kemungkinannya untuk mencetak pada jam 3 pagi daripada jam 3 sore.
Untuk model proses Poisson yang tidak homogen , kuncinya adalah mendapatkan perkiraan yang baik tentang peluang pekerjaan cetak pada waktu tertentu pada hari tertentu.
Namun, jika waktu cetak ini untuk siswa di kelas, itu bisa sangat rumit, karena mereka tidak mungkin mandiri dan sehingga proses Poisson tidak akan bekerja dengan baik.
Berikut ini tautan ke makalah tentang aplikasi kejahatan.
sumber
Berdasarkan pada prediksi kemungkinan waktu menggunakan statistik pemindaian Bayesian multivariat (MBSS) dapat membantu. MBSS ini memiliki keuntungan meningkatkan ketepatan waktu dan akurasi deteksi peristiwa.
sumber