Memodelkan kriket bowler mengeluarkan batsmen

9

Saya memiliki satu set data yang merinci banyak game kriket (beberapa ribu). Dalam kriket "bowler" berulang kali melempar bola pada suksesi "batsmen". Bowler sedang mencoba untuk mendapatkan batsman "keluar". Dalam hal ini sangat mirip dengan pitcher dan batter di baseball.

Jika saya mengambil seluruh dataset dan membagi jumlah total bola yang membuat batsman keluar dengan jumlah total bola bowled, saya dapat melihat bahwa saya akan memiliki kemungkinan rata-rata seorang bowler mengeluarkan batsman - itu akan menjadi sekitar 0,03 ( semoga saya tidak salah?)

Apa yang saya tertarik adalah apa yang bisa saya lakukan untuk mencoba dan menghitung probabilitas batsman tertentu yang dicoret oleh bowler tertentu pada bola berikutnya.

Dataset cukup besar sehingga setiap bowler yang diberikan akan memagari ribuan bola ke berbagai batsmen. Jadi saya percaya bahwa saya hanya bisa membagi jumlah belokan yang dicapai oleh pemain bola dengan jumlah bola yang dia lewati untuk menghitung probabilitas baru bagi pemain bowler tertentu yang keluar dari bola berikutnya.

Masalah saya adalah dataset tidak cukup besar untuk menjamin bahwa bowler yang diberikan telah bowled sejumlah bola signifikan secara statistik pada setiap batsmen yang diberikan. Jadi, jika saya tertarik untuk menghitung kemungkinan keluar untuk bowler tertentu menghadapi batsmen tertentu, saya tidak berpikir ini tidak dapat dilakukan dengan cara sederhana yang sama.

Pertanyaan saya adalah apakah pendekatan berikut ini valid:

Di seluruh dataset kemungkinan bola keluar adalah 0,03.
Jika saya menghitung bahwa rata-rata bowler A memiliki kemungkinan untuk keluar dari 0,06 (yaitu dua kali lebih mungkin dari bowler rata-rata),
dan rata-rata batsman B memiliki kemungkinan untuk keluar dari 0,01 (sepertiga kemungkinan sebagai rata-rata batsmen),
apakah valid untuk mengatakan probabilitas bahwa batsman tertentu keluar pada bola di sebelah bowler spesifik akan menjadi 0,06 * (0,01 / 0,03) = 0,02?

probability modeling games Ravi
sumber

Jika bowler memilih untuk melempar bola berulang kali , mereka akan dengan cepat menemukan diri mereka dikeluarkan dari kemampuan untuk mangkuk lagi dalam permainan.

Glen_b -Reinstate Monica

2

$\DeclareMathOperator{\E}{\mathbb{E}}$

Jika saya mengambil seluruh dataset dan membagi jumlah total bola yang membuat batsman keluar dengan jumlah total bola bowled, saya dapat melihat bahwa saya akan memiliki kemungkinan rata-rata seorang bowler mengeluarkan batsman - itu akan menjadi sekitar 0,03 (mudah-mudahan Saya belum salah?)

Sayangnya, ini mungkin sudah tidak persis apa yang Anda cari.

Misalkan kita punya bowler tunggal, dan dua batsmen: Don Bradman dan saya. (Saya tahu sangat sedikit tentang kriket, jadi jika saya melakukan sesuatu di sini, beri tahu saya.) Permainannya seperti:

Don pergi ke kelelawar, dan keluar di mangkuk ke-99.
Saya pergi ke kelelawar, dan segera keluar.
Don pergi ke kelelawar, dan keluar di mangkuk ke-99.
Saya pergi ke kelelawar, dan segera keluar.

Dalam hal ini, ada empat out dari 200 mangkuk, sehingga probabilitas marginal dari seorang bowler mengeluarkan batsman diperkirakan 4/200 = 2%. Tapi sungguh, probabilitas Don untuk keluar lebih seperti 1%, sedangkan saya 100%. Jadi, jika Anda memilih batsman dan bowler secara acak, probabilitas bahwa bowler ini mengeluarkan batsman ini kali ini lebih seperti (50% kemungkinan Anda memilih Don) * (1% peluang dia keluar) + (50% peluang Anda memilih saya) * (100% peluang saya keluar) = 50,05%. Tetapi jika Anda memilih pitch secara acak, maka peluangnya 2% untuk keluar. Jadi, Anda perlu berpikir hati-hati tentang model pengambilan sampel mana yang Anda pikirkan.

Bagaimanapun, proposal Anda tidak gila. Lebih simbolis, biarkan menjadi bowler dan batsman; biarkan adalah probabilitas bahwa mendapat keluar. Lalu Anda mengatakan: $b$ $m$ $f(b, m)$ $b$ $m$

f (b, m) = \frac{E_{m^{'}} [f (b, m^{'})] E_{b^{'}} [f (b^{'}, m)]}{E_{b^{'}, m^{'}} [f (b^{'}, m^{'})]} .

$f(b, m) = \frac{\E_{m'}[ f(b, m') ] \E_{b'}[ f(b', m) ]}{\E_{b', m'}[ f(b', m') ]} .$

Ini memang memiliki sifat yang diinginkan yaitu:

E_{b, m} [f (b, m)] = \frac{E_{b, m^{'}} [f (b, m^{'})] E_{b^{'}, m} [f (b^{'}, m)]}{E_{b^{'}, m^{'}} [f (b^{'}, m^{'})]} = E_{b, m} [f (b, m)];

$\E_{b,m}[f(b, m)] = \frac{\E_{b,m'}[ f(b, m') ] \E_{b',m}[ f(b', m) ]}{\E_{b',m'}[ f(b', m') ]} = \E_{b,m}[ f(b, m) ] ;$

b

$b$

m

$m$

\begin{matrix} C := E_{b, m} [f (b, m)] \\ g (b) := E_{m} [f (b, m)] / \sqrt{C} \\ h (m) := E_{b} [f (b, m)] / \sqrt{C} \\ so that f (b, m) = g (b) h (m) . \end{matrix}

$\begin{gather} C := \E_{b, m}[f(b, m)] \\ g(b) := \E_{m}[f(b, m)] / \sqrt{C} \\ h(m) := \E_{b}[f(b, m)] / \sqrt{C} \\ \text{so that } f(b, m) = g(b) \, h(m) .\end{gather}$

g (b)

$g(b)$

h (m)

$h(m)$

$\E_{b'}[f(b', m)]$ $b'$

Tentu saja data Anda tidak akan terlihat seburuk ini, tetapi tergantung pada struktur liga atau apa pun, mungkin ada beberapa elemen dari masalah itu.

$f$ $g(b)$ $h(m)$ $r$ $f(b, m) = g(b)^T h(m)$ $r>1$ sebagai pengompleksan model Anda dari skor "kualitas" tunggal hingga skor di sepanjang berbagai dimensi: mungkin bowler tertentu melakukan lebih baik terhadap jenis batsmen tertentu. (Ini telah dilakukan misalnya untuk game NBA .)

$F$

\underset{F}{\underset{⏟}{[\begin{matrix} f (b_{1}, m_{1}) & f (b_{1}, m_{2}) & \dots & f (b_{1}, m_{M}) \\ f (b_{2}, m_{1}) & f (b_{2}, m_{2}) & \dots & f (b_{2}, m_{M}) \\ ⋮ & ⋮ & ⋱ & ⋮ \\ f (b_{N}, m_{1}) & f (b_{N}, m_{2}) & \dots & f (b_{N}, m_{M}) \end{matrix}]}} = \underset{G}{\underset{⏟}{[\begin{matrix} g (b_{1}) \\ ⋮ \\ g (b_{N}) \end{matrix}]}} \underset{H^{T}}{\underset{⏟}{{[\begin{matrix} h (m_{1}) \\ ⋮ \\ h (m_{M}) \end{matrix}]}^{T}}}

$\underbrace{\begin{bmatrix} f(b_1, m_1) & f(b_1, m_2) & \dots & f(b_1, m_M) \\ f(b_2, m_1) & f(b_2, m_2) & \dots & f(b_2, m_M) \\ \vdots & \vdots & \ddots& \vdots \\ f(b_N, m_1) & f(b_N, m_2) & \dots & f(b_N, m_M) \end{bmatrix}}_{F} = \underbrace{\begin{bmatrix} g(b_1) \\ \vdots \\ g(b_N) \end{bmatrix}}_{G} \underbrace{\begin{bmatrix} h(m_1) \\ \vdots \\ h(m_M) \end{bmatrix}^T}_{H^T}$

N \times M

$N \times M$

F

$F$

N \times r

$N \times r$

G

$G$

M \times r

$M \times r$

H

$H$

$F$ $F$ $F$

Anda dapat membuat model probabilitas seperti, katakan:

\begin{matrix} G_{i k} \sim N (0, σ_{G}^{2}) \\ H_{j k} \sim N (0, σ_{H}^{2}) \\ F_{i j} = G_{i}^{T} H_{j} \\ R_{i j} \sim B i n o m i a l (n_{i j}, F_{i j}) \end{matrix}

$\begin{gather} G_{ik} \sim \mathcal{N}(0, \sigma_G^2) \\ H_{jk} \sim \mathcal{N}(0, \sigma_H^2) \\ F_{ij} = G_i^T H_j \\ R_{ij} \sim \mathcal{Binomial}(n_{ij}, F_{ij}) \end{gather}$

n_{i j}

$n_{ij}$

R_{i j}

$R_{ij}$

σ_{G}

$\sigma_G$

σ_{H}

$\sigma_H$

$n$ $F_{ij}$ $[0, 1]$ $G$ $H$

Dougal
sumber

1

@Ravi Ini panjang, mungkin tidak dijelaskan dengan jelas, dan saya tidak tahu tingkat latar belakang Anda dengan masalah seperti ini. Tapi jangan ragu untuk bertanya tentang bagian yang tidak jelas. Selain itu, karena data Anda satu-satu, Anda juga dapat mempertimbangkan untuk menggunakan katakanlah Elo .

Dougal

Terima kasih telah meluangkan waktu untuk menulis jawaban berkualitas sangat tinggi ini. Memang saya hanya tahu statistik dasar sekarang jadi banyak dari ini baru bagi saya. Namun itu menunjukkan kepada saya dengan sangat jelas apa yang harus dibaca untuk memahami masalah ini dengan tepat yang persis apa yang saya inginkan. Semoga setelah beberapa hari (atau bertahun-tahun!) Studi saya akan dapat memahami jawaban Anda dengan lebih baik.

Ravi

Terima kasih. Saya memang punya pertanyaan tentang Elo. Karena agak lama saya membuka pertanyaan baru [di sini] :( stats.stackexchange.com/questions/230518/… )

Ravi

0

Anda tidak dapat menyimpulkan probabilitas yang benar bahwa B akan keluar mengingat A adalah bowler jika A dan B tidak pernah bertemu di lapangan hanya berdasarkan rata-rata mereka dengan pemain lain .

oW_
sumber

3

Meskipun Anda mungkin benar tentang kriket, kemampuan sistem peringkat di permainan keterampilan lain seperti catur untuk memprediksi hasil pertandingan antara orang-orang yang belum pernah berkompetisi menyarankan sebaliknya.

whuber

2

@whuber Setuju - Saya pikir kriket sama persis dengan interaksi kompetitif lainnya. Kriket tidak yang berbeda.

Glen_b -Reinstate Monica

Memodelkan kriket bowler mengeluarkan batsmen

Jawaban: