Saya menganalisis dataset yang berisi pengamatan dari n sejumlah upaya oleh pemain dalam sebuah permainan. Jika saya membangun model regresi untuk memprediksi hasil dari setiap upaya yang diberikan 1 atau lebih deskriptor mengenai upaya masing-masing pemain , bagaimana cara mengukur berapa banyak upaya pemain harus sebelum deskriptor tertentu menjadi "bermakna" atau "signifikan" diberikan dataset kami ?
Contoh yang baik adalah sekelompok orang yang bermain panah. Seorang pemula yang absolut mungkin akan menutup matanya, melempar panah, dan mengenai mata banteng. Jelas, kita tahu itu adalah kesempatan murni, dia belum pernah bermain sebelumnya, dan heck, dia bahkan mungkin mabuk. Tetapi katakanlah dia melempar 5 anak panah lebih banyak dan memukul mata seekor banteng 3 kali lebih banyak dari mereka 5. Dia sekarang telah melemparkan 6 anak panah dan mengenai mata banteng 50% dari waktu. Sekarang semuanya mulai mencurigakan ...
Pada titik apakah pemula sejati ini melempar panah mata banteng yang cukup, dan berapa banyak upaya yang dia butuhkan sebelum kita dapat mengatakan dia memiliki bakat serius di atas pemain yang lebih berpengalaman lainnya? Apa istilah ini dalam statistik dan di mana saya bisa belajar lebih banyak tentang itu?
Penafian: Saya mencoba untuk menghindari penggunaan istilah statistik yang dimuat seperti "signifikansi" dan "pengamatan" sebanyak mungkin, meskipun saya merasa mereka sesuai di tempat-tempat tertentu di sini.
Jika ada yang bisa mengarahkan saya ke arah yang benar, itu akan fantastis. Terima kasih!!
Jawaban:
Darts adalah gim yang paling sederhana. Setiap pemain mulai dengan skor 501 dan bergantian untuk melemparkan 3 anak panah. Skor untuk setiap belokan dihitung dan dikurangkan dari total pemain. Bullseye skor 50, cincin luar skor 25 dan panah di dobel atau treble menghitung ganda atau treble skor segmen.
Gambar dari
Sekarang probabilitas telah diperiksa di tempat lain . Di situs itu, kita diberi tahu "Seorang pemain dart yang memiliki keterampilan sedang akan memiliki standar deviasi yang lebih besar; walaupun tembakan mungkin, secara rata-rata, berpusat di sekitar target yang sama, mereka akan didistribusikan di wilayah yang lebih luas. Seorang pemain dart yang buruk akan memiliki standar deviasi yang tinggi dan tembakan mereka akan, secara probabilistik, tersebar di wilayah yang jauh lebih luas. " Yaitu ,.
Jadi, untuk menjawab pertanyaan, kami melakukan apa yang selalu kami lakukan. Kami membangun histogram skor, dan untuk permainan itu sendiri kami mungkin menggunakan skor 501, dan kemudian kami cocok dengan fungsi kerapatan, dan kemudian kami menguji fungsi kerapatan terhadap fungsi kerapatan pemain lain. Jadi, kami membutuhkan data yang cukup sehingga lokasi kami dan penyimpangannya memiliki kekuatan prediksi yang cukup untuk membedakan dengan benar antara pemain. Semakin sedikit data, semakin kabur jawaban, dan tidak ada angka ajaib untuk itu, semakin banyak semakin meriah.
sumber