Model "canggih" untuk distribusi gol yang dicetak dalam pertandingan sepak bola adalah model Dixon dan Robinson (1998) "Model Proses Kelahiran untuk Pertandingan Sepak Bola Asosiasi" yang menjelaskan dua fenomena utama:
1) Lebih banyak gol yang dicetak pada akhir pertandingan daripada di awal (dihipotesiskan karena kelelahan yang diderita oleh kedua tim)
2) Tingkat penilaian tergantung pada garis skor saat ini untuk berbagai alasan seperti tim dengan keunggulan menjadi puas diri atau tim lebih memilih untuk bermain imbang daripada mengambil risiko kehilangan dengan menang.
Model ini mengasumsikan bahwa gol yang dicetak oleh tim tuan rumah dan tandang dalam pertandingan mengikuti proses Poisson yang tidak homogen. Biarkan menunjukkan waktu yang berlalu dalam pertandingan, dinormalisasi untuk jatuh di antara dan , vektor panjang- menunjukkan waktu di mana tim tuan rumah mencetak gol dan vektor panjangkan menunjukkan waktu di mana tim tamu mencetak gol. Kemungkinan untuk pertandingan adalah
di mana adalah angka penilaian untuk tim tuan rumah pada waktu t bergantung pada kombinasi faktor-faktor homogen waktu (mis. kemampuan menyerang tim tuan rumah versus kemampuan bertahan tim tandang, keunggulan kandang) dan faktor waktu tidak homogen (misalnya garis skor pada waktu t ). Demikian pula untuk \ mu (t) .
Kedua proses itu tergantung karena ketika suatu tim skor garis skor berubah dan angka penilaian itu sendiri tergantung garis skor.
Kemungkinan dapat dengan mudah dievaluasi dengan melakukan integrasi dalam eksponen secara numerik. Oleh karena itu sangat mudah untuk menghitung parameter model (kemampuan tim, keunggulan rumah, efek waktu, parameter garis skor, dll.) Melalui kemungkinan maksimum.
Dalam hal prediksi, jumlah bunga yang jelas adalah:
- : tim tuan rumah menang
- : tim tamu menang
- : menggambar
- Probabilitas garis skor tertentu, misalnya
- Probabilitas total gol dalam pertandingan, mis.
Untuk menghitung jumlah ini (kira-kira) diberikan satu set parameter model, kita bisa menggunakan metode Monte Carlo untuk menghasilkan kecocokan sesuai dengan proses ini dan kemudian menghitung frekuensi setiap skor akhir. Simulasi dari proses relatif mudah, dengan menghasilkan tujuan dari proses Poisson homogen tunggal yang menyelimuti bersama dengan sampel penolakan dan kemudian mendistribusikannya ke tim tuan rumah atau tim tamu yang sesuai.
Kelemahan dari pendekatan ini, jelas, beban komputasi simulasi Monte Carlo. Pertimbangkan untuk mencoba membuat prediksi secara real-time ketika pertandingan dimainkan, yang mungkin banyak terjadi secara bersamaan, dan itu dengan cepat menjadi alasan untuk khawatir.
Pertanyaan saya, oleh karena itu, apakah ada pendekatan alternatif yang dapat kita pertimbangkan yang tidak menimbulkan seperti biaya komputasi yang tinggi (bahkan jika mereka bergantung pada perkiraan yang mengorbankan akurasi untuk kemudahan perhitungan)?
Untuk lebih jelasnya, saya tidak mencari saran (dasar) tentang bagaimana mengimplementasikan secara efisien simulasi Monte Carlo yang telah saya tulis dalam multi-threaded C, menggunakan angka acak semu yang telah dibuat sebelumnya menggunakan membuka gulungan dan mengeksploitasi eksploitasi sedikit demi sedikit untuk mencapai tingkat penerimaan yang sangat tinggi. Jika Anda berpikir masih ada ruang untuk peningkatan kinerja yang dramatis maka tentu saja saya semua telinga tetapi saya benar-benar mencari pendekatan yang berbeda secara mendasar!
sumber