Membandingkan 0/10 hingga 0/20

10

Ketika membahas tingkat pencapaian tugas, apakah ada cara untuk menunjukkan bahwa 0 dari 20 upaya "lebih buruk" daripada 0 dari 10 upaya?

vinne
sumber
1
Anda dapat mencoba menggunakan en.wikipedia.org/wiki/Additive_smoothing tetapi akan agak melambaikan tangan daripada bukti kuat
abukaj
Bagaimana Anda tahu itu lebih buruk? Misalnya, jika hanya 10 upaya yang mungkin, maka Anda tidak tahu apa yang akan menjadi skor dengan lebih banyak upaya.
Tim
4
Mungkin interval kepercayaan untuk estimasi proporsi?
mdewey
5
Ini sepertinya pertanyaan yang masuk akal bagi saya. Ini didasarkan pada intuisi normal yang dapat didiskusikan, & ada cara statistik (misalnya, Bayesian) untuk mengatasi masalah ini. Saya memberikan suara untuk tetap terbuka.
gung - Reinstate Monica
1
Saya setuju dengan @ung. Ini pertanyaan yang bagus.
Alexis

Jawaban:

3

Misalkan kita tahu probabilitas keberhasilan dalam suatu usaha. Dalam hal ini kami menghitung probabilitas 0 dari 10 dan 0 dari 20 kasus.

Namun, dalam hal ini kita pergi sebaliknya. Kami tidak tahu probabilitas, kami memiliki data dan kami mencoba memperkirakan probabilitas.

Semakin banyak kasus yang kita miliki, semakin pasti kita mengenai hasil. Jika saya akan melempar koin dan itu akan menjadi kepala, Anda tidak akan terlalu yakin bahwa itu berkepala dua. Jika saya akan melemparnya 1.000 kali dan itu akan menjadi semua kepala, tidak mungkin itu seimbang.

Ada metode yang dirancang untuk mempertimbangkan jumlah jalan saat memberikan estimasi. Salah satunya adalah aditif smoothing yang dikomentari @abukaj di atas. Dalam penghalusan aditif kami menambahkan sampel pseudo tambahan menjadi pertimbangan. Dalam kasus kami, alih-alih ke jejak yang kami lihat kami menambahkan dua lagi - satu berhasil dan satu gagal.

  • Dalam kasus pertama probabilitas yang dihaluskan adalah = ~ 8,3% 11+010+1+1112
  • Dalam kasus kedua kita akan mendapatkan = ~ 4,5% 11+020+1+1122

Perhatikan bahwa penghalusan aditif hanya satu metode estimasi. Anda akan mendapatkan hasil berbeda dengan metode berbeda. Bahkan dengan aditif yang dihaluskan sendiri, Anda akan mendapatkan hasil yang berbeda jika Anda menambahkan 4 sampel semu.

Metode lain menggunakan interval kepercayaan seperti yang disarankan @mdewey. Semakin banyak sampel yang kita miliki, semakin pendek interval kepercayaannya. Ukuran interval kepercayaan sebanding dengan akar kuadrat sampel - . Oleh karena itu, menggandakan jumlah sampel akan menyebabkan interval kepercayaan lebih pendek .1n2

Mean dalam kedua kasus adalah 0. Kami mengambil tingkat kepercayaan 90% (z = 1,645)

  • Dalam kasus pertama kita akan mendapatkan 0 + ~ 52%1.64510
  • Dalam kasus kedua kita akan mendapatkan 0 + ~ 36%1.64520

Dalam hal data hilang, ada ketidakpastian. Asumsi yang Anda buat dan data eksternal yang akan Anda gunakan akan mengubah apa yang akan Anda dapatkan.

Dl
sumber
1
Terima kasih banyak, Dan Levin. Jawaban Anda cukup jelas untuk diikuti oleh non-matematikawan, namun cukup kuat bagi saya untuk secara intuitif menerima penjelasan Anda. Terima kasih semua komentator atas masukan Anda.
vinne
1

Memperluas gagasan memohon interval kepercayaan, ada konsep interval binomial yang tepat.

Distribusi binomial adalah jumlah total keberhasilan dalam uji coba independen yang berakhir dengan 0 (kegagalan) atau 1 (sukses). Probabilitas untuk memperoleh 1 (kesuksesan) secara tradisional dilambangkan , dan komplemennya adalah . Maka hasil probabilitas standar adalah bahwa probabilitas tepat keberhasilan dalam percobaan adalahq = 1 - p k npq=1pkn

pn,k=(nk)pkqnk=n!k!(nk)!pkqnk

Konsep interval kepercayaan adalah untuk mengikat sekumpulan nilai yang mungkin dari parameter model (di sini, probabilitas keberhasilan ) sehingga kita dapat membuat pernyataan probabilistik (well, frequentist ) tentang apakah nilai parameter sebenarnya berada di dalam interval ini (yaitu , bahwa jika kita mengulangi percobaan probabilistik dengan membuat 10 atau 20 percobaan, dan membangun interval kepercayaan dengan cara yang ditentukan, kita akan mengamati bahwa nilai sebenarnya dari parameter berada di dalam interval 95% dari waktu).p

Dalam hal ini, kita dapat memecahkan dalam rumus itu: p

pn,0=(1p)n

Jadi, jika kita menginginkan interval 95% satu sisi, kita akan menetapkan untuk memecahkan probabilitas hitung nol yang diamati paling banyak 5%. Untuk , jawabannya adalah (yaitu, paling ekstrim, jika probabilitas keberhasilan dalam setiap percobaan adalah 13,9%, maka probabilitas untuk mengamati nol keberhasilan adalah 5%). Untuk , jawabannya adalah . Jadi dari sampel , kami belajar lebih banyak dari sampel , dalam arti bahwa kami dapat `` mengecualikan '' kisaran bahwa sampel masih menyisakan masuk akal.pn,0=5%n=20[0%,13.9%]n=10[0%,25.9%]n=20n=10[13.9%,25.9%]n=10

Tugas
sumber
0

Pendekatan Bayesian

  • Biarkan untuk menjadi serangkaian variabel acak IID Bernoulli dengan parameter .Xii=1,np
  • Mari kita mewakili ketidakpastian kita dari parameter dengan menganggapnya mengikuti distribusi Beta dengan hyperparameters dan .p αβ

Fungsi kemungkinan adalah Bernoulli dan distribusi Beta adalah konjugat sebelum distribusi Bernoulli, maka posterior mengikuti distribusi Beta. Selanjutnya, posterior diparameterisasi dengan:

α^=α+i=1nXiβ^=β+ni=1nXi

Karena itu:

E[pX1,,Xn]=α^α^+β^=α+i=1nXiα+β+n

Jadi jika Anda melihat 10 kegagalan, ekspektasi adalah , dan jika Anda melihat 20 kegagalan, ekspektasi Anda terhadap adalah . Semakin banyak kegagalan yang Anda lihat, semakin rendah ekspektasi Anda akan .pαα+β+10pαα+β+20p

Apakah ini argumen yang masuk akal? Itu tergantung pada bagaimana perasaan Anda tentang statistik Bayesian, apakah Anda bersedia memodelkan ketidakpastian pada beberapa parameter menggunakan mekanisme probabilitas. Dan itu tergantung pada seberapa masuk akal pilihan Anda akan prior.p

Matthew Gunn
sumber