Sistem pemeringkatan Elo menggunakan algoritma minimisasi gradient descent dari fungsi kehilangan lintas-entropi antara probabilitas yang diharapkan dan yang diamati dari suatu hasil dalam perbandingan berpasangan. Kita dapat menulis fungsi kerugian umum sebagai
di mana jumlah dilakukan atas semua hasil dan semua lawan . adalah frekuensi yang diamati dari peristiwa i dan q i frekuensi yang diharapkan.
Dalam hal hanya dua hasil yang mungkin (menang atau kalah) dan satu lawan yang kita miliki
Jika adalah peringkat pemain dan adalah peringkat pemain kita dapat membangun probabilitas yang diharapkan sebagai
di mana dan p i adalah probabilitas yang diharapkan dan diamati dari kemenangan pemain i terhadap pemain j . Ini adalah aturan pembaruan.two outcomes
Dengan adanya undian, kita dapat menggeneralisasi model di atas termasuk dan hasil ketiga dengan probabilitas
qi(w)=eπi
Dan kita dapat membangun fungsi Rugi sebagai
di mana masing-masing kemungkinan yang diamati , dan dan q ( w ) , q ( l ) , q ( d ) kemungkinan yang diharapkan , dan . Dalam kasus terakhir, aturan pembaruan adalahwin
loose
draw
win
loose
draw
di mana dan q j ( d ) adalah probabilitas yang diharapkan dari pemain i untuk menang dan bermain imbang melawan pemain j . Dan di mana p i ( w ) dan p i ( d ) adalah probabilitas yang diamati dari pemain i untuk menang dan bermain imbang melawan pemain j . Ini adalah aturan pembaruan.three outcome
Pertanyaannya adalah, mengapa sistem peringkat Elo menggunakan two outcomes
aturan pembaruan bahkan di hadapan undian?
sumber