Apa cara yang tepat untuk mengevaluasi / menentukan konsistensi penembakan 3-poin pemain NBA? Sebagai contoh, saya memiliki pemain yang menembak 37% dari jarak 3 poin dan membutuhkan 200 upaya sepanjang tahun.
Saya sedang mempertimbangkan untuk mengambil rata-rata bergulir 3-poin% dari jumlah tembakan yang berubah-ubah (katakanlah 20). Kemudian menggunakan rata-rata tersebut untuk menentukan standar deviasi dari rata-rata 37%. Menggunakan ukuran sampel bergulir dari 20 bidikan hanya memungkinkan untuk presisi 5% dalam persentase pemotretan, tapi saya khawatir bahwa menggunakan terlalu banyak bidikan tidak akan mengungkapkan ketidakkonsistenan dalam kinerja.
Apakah ada pendekatan yang lebih baik untuk menentukan konsistensi?
do an analysis of runs
...Jawaban:
Seperti yang dinyatakan pengguna lain dalam komentar di atas, tes lari adalah cara untuk menganalisis data pemotretan Anda. Ini menguji hipotesis bahwa unsur-unsur urutannya saling independen. Jika hipotesis ditolak, maka Anda dapat mengatakan bahwa 3-point shooting pemain tidak konsisten.
Saya juga ingin mengarahkan Anda ke artikel ini karena ini terkait langsung dengan analisis Anda.
sumber
Saya pikir tes lari adalah ide yang bagus. Bagi saya, dengan menganalisis data dalam "potongan", maksud Anda adalah membuat proxy untuk atau mengontrol "tangan panas" dalam konsistensi pemain. Ada banyak literatur tentang fenomena ini di luar sana. Salah satu makalah terbaik dibahas oleh Gelman di blog-nya kembali pada bulan Juli 2015. Judul postingnya adalah, "Hei, coba tebak? Benar-benar ada tangan panas!" ( http://andrewgelman.com/2015/07/09/hey-guess-what-there-really-is-a-hot-hand/ ). Makalah yang dilaporkan Gelman merupakan bantahan bagi banyak literatur sebelumnya sejauh merinci kesalahan yang dibuat oleh analisis sebelumnya dari fenomena hot tangan. Pekerjaan sebelumnya berfokus pada keseluruhan yang bertentangan dengan probabilitas bersyarat. Makalah ini mengajukan model probabilitas sekuensial baru (lihat tautan untuk referensi ke makalah).
Satu metrik konsistensi yang baik yang harus mengendalikan perbedaan dalam, misalnya, jumlah bidikan yang diambil, adalah koefisien variasi. CV adalah ukuran variabilitas skala tak berdimensi dan dihitung dengan membagi deviasi std dengan mean. Masalah yang berusaha dipecahkannya adalah bahwa penyimpangan std dinyatakan dalam skala unit yang sedang diukur, yaitu, itu bukan skala invarian. Ini berarti bahwa metrik dengan nilai rata-rata tinggi juga akan cenderung memiliki deviasi std yang lebih tinggi daripada metrik dengan nilai rata-rata rendah. Jadi, misalnya, karena perbedaan dalam nilai rata-rata, ukuran variabilitas tekanan darah diastolik dan sistolik tidak dapat dibandingkan secara langsung. Dengan mengambil CV, variabilitas mereka menjadi sebanding. Hal yang sama berlaku untuk banyak metrik lainnya seperti harga saham,
Dengan demikian, CV dapat dihitung untuk banyak metrik dan tipe skala, tidak termasuk informasi kategori dan tindakan dengan nilai negatif.
sumber