Bagaimana saya bisa memprediksi peluang bahwa tim dodgeball akan menang berdasarkan sejarah kemenangan para pemainnya?

13

Bayangkan ada 80 pemain dodgeball di dunia. Masing-masing dari mereka telah memainkan ribuan permainan dodgeball dengan 79 pemain lainnya dalam urutan acak lebih atau kurang. Ini adalah dunia tanpa tim (misalnya, setiap pemain memiliki peluang untuk direkrut dalam tim mana pun di setiap pertandingan). Saya tahu tingkat kemenangan sebelumnya dari setiap pemain (misalnya, satu telah memenangkan 46% dari semua pertandingan sebelumnya, yang lain telah memenangkan 56% dari semua pertandingan sebelumnya). Katakanlah ada pertandingan yang akan datang dan saya tahu siapa yang bermain di setiap tim. Saya juga tahu tingkat kemenangan mereka sebelumnya.

Apa cara terbaik untuk menghitung probabilitas setiap tim yang menang berdasarkan komposisi tim?

Jika memerlukan perhitungan yang relatif maju (mis., Regresi logistik) beri tahu saya beberapa hal spesifik. Saya cukup akrab dengan SPSS, tetapi saya lebih suka tidak perlu mengajukan pertanyaan lanjutan.

Selain itu, bagaimana saya mengeksplorasi akurasi metode saya menggunakan data arsip? Saya tahu itu tidak akan jelas dipotong karena sebagian besar pemain berkisar sekitar 40-60%, tapi tetap saja.

Untuk lebih spesifik, peluang apa yang akan dimenangkan tim A?

A - terdiri dari individu dengan tingkat kemenangan sebelumnya 52%, 54%, 56%, 58%, 60% B - terdiri dari individu dengan tingkat kemenangan sebelumnya 48%, 55%, 56%, 58%, 60%

(Ini hanya contoh acak untuk tujuan ilustrasi. Dua tim yang cukup bagus.)

Sunting: Apakah ada cara untuk memulai dengan algoritma yang sangat sederhana dan kemudian melihat cara kerjanya? Mungkin kita bisa menjumlahkan persentase dari masing-masing tim dan memperkirakan bahwa yang memiliki persentase tertinggi akan menang. Tentu saja klasifikasi kami tidak akan akurat, tetapi lebih dari ribuan game yang diarsipkan kami dapat melihat apakah kami dapat memprediksi lebih baik daripada kebetulan.

Behacad
sumber
Bukankah itu hanya pembagian sederhana dari rata-rata? AvgTeam1WinP/ AvgTeam2WinP? Itu harus menghasilkan peluang yang team1akan menang melawan team2.
PascalVKooten

Jawaban:

2

Kedengarannya seperti pekerjaan untuk Bayes yang naif . Saya tidak begitu mengerti teori di baliknya, jadi sayangnya saya tidak bisa memberi Anda contoh tetapi Bayes bekerja dengan data (arsip) yang diketahui untuk menarik kesimpulan.

Saya pikir Bayes hanya tersedia di Server Statistik SPSS jadi jika Anda memiliki akses ke salah satunya, Anda beruntung. Atau Anda dapat menggunakan Weka yang juga mencakup sekelompok pengklasifikasi lain, jadi mungkin Anda menjalankan eksperimen dan memberi tahu kami hasilnya?

SEBUAHSEBUAHBSEBUAH

sumpah
sumber
Terima kasih atas komentar Anda dan untuk edit Anda. Saya pikir pendekatan Bayesian atau pembelajaran mesin mungkin yang terbaik. Sayangnya saya relatif tidak terbiasa dengan pendekatan ini.
Behacad
2

Benarkah Anda tidak hanya memiliki persentase tersebut tetapi juga semua hasil game individual? Maka saya akan menyarankan paket r PlayerRatings. Paket ini tidak hanya membahas masalah seperti cara menghitung kekuatan pemain (menggunakan algoritme seperti elo atau glicko), tetapi juga menawarkan fungsi yang dapat memprediksi hasil pertandingan di masa mendatang.

Sebagai contoh, periksa: http://cran.r-project.org/web/packages/PlayerRatings/vignettes/AFLRatings.pdf

rdatasculptor
sumber
0

Bukankah itu hanya pembagian sederhana dari rata-rata? AvgTeam1WinP/AvgTeam2WinP ? Itu harus menghasilkan peluang yang team1akan menang melawan team2.

Jika saya mempertimbangkan hal berikut:

Jika player1akan bermain melawan player2dalam tim "1-orang", Anda akan setuju bahwa peluang bahwa pemain1 akan menang melawan pemain2 akan menjadi probabilitas bahwa pemain1 akan menang melawan acak dibagi dengan probabilitas bahwa pemain2 akan menang secara acak (ini tentu saja hanya berlaku jika Anda menganggap win% akurat, seperti dalam batas asimptotiknya), cukup:

OddsP1VsP2 = WinProbabilityP1 / WinProbabilityP2 

Jika Anda berpendapat bahwa tidak ada efek interaksi dari beberapa pemain yang buruk dan karenanya mempengaruhi skor lebih negatif dari yang diharapkan *, atau, beberapa pemain yang benar-benar bagus mempengaruhi skor lebih positif daripada yang diharapkan **, maka tampaknya logis bahwa Anda dapat ambil saja probabilitas rata-rata untuk setiap pemain di setiap tim.

* Jika kombinasi 60%, 60%, 60%, 60% dianggap lebih baik daripada tim seperti 70%, 70%, 70%, 30%, di mana satu pemain yang buruk akan menghasilkan peluang yang lebih buruk bagi tim meskipun rata-rata adalah sama. Tanpa hipotesis tambahan, pertanyaan khusus itu tidak mungkin diatasi.

** Demikian pula, jika 50,50,50,90 tidak dianggap sama dengan 60,60,60,60, maka hal yang sama berlaku.

PascalVKooten
sumber