Rata-rata batting Bayesian sebelumnya

23

Saya ingin mengajukan pertanyaan yang terinspirasi oleh jawaban yang sangat baik untuk pertanyaan tentang intuisi untuk distribusi beta. Saya ingin mendapatkan pemahaman yang lebih baik tentang derivasi untuk distribusi sebelumnya untuk rata-rata pukulan. Sepertinya David mendukung parameter dari mean dan kisaran.

Dengan asumsi bahwa rata-rata adalah dan standar deviasi adalah , dapatkah Anda mundur dan dengan menyelesaikan dua persamaan ini: 0,18 α β α0,270,18αβ

αα+β=0,27αβ(α+β)2(α+β+1)=0,182
Dimitriy V. Masterov
sumber
3
Jujur, saya hanya menyimpan nilai grafik di R sampai terlihat benar.
David Robinson
1
di mana Anda mendapatkan standar deviasi menjadi 0,18?
appleLover
Bagaimana Anda menemukan standar deviasi ini? Tahukah Anda sebelumnya?
Maria Lavrovskaya

Jawaban:

21

Perhatikan itu:

αβ(α+β)2=(αα+β)(1-αα+β)

Ini berarti varians karena itu dapat dinyatakan dalam arti sebagai

σ2=μ(1-μ)α+β+1

Jika Anda ingin rata-rata .27 dan standar deviasi .18 (varians 0,032 ), hitung saja:

α+β=μ(1-μ)σ2-1=.27(1-.27)0,032-1=5.083333

Sekarang Anda sudah tahu total, dan mudah:αβ

α=μ(α+β)=.275.083333=1.372499β=(1-μ)(α+β)=(1-.27)5.083333=3.710831

Anda dapat memeriksa jawaban ini di R:

> mean(rbeta(10000000, 1.372499, 3.710831))
[1] 0.2700334
> var(rbeta(10000000, 1.372499, 3.710831))
[1] 0.03241907
David Robinson
sumber
David, apakah Anda kebetulan mengikuti penelitian bisbol? Ada beberapa teknik yang bersaing di luar sana untuk menemukan dan , jadi saya bertanya-tanya apakah Anda memiliki pendapat tentang masalah ini jika Anda melakukan sesuatu selain hanya mencoba menemukan grafik yang terlihat masuk akal. βαβ
Michael McGowan
Saya tidak terlalu mengikuti sabermetrics- dalam jawaban lain itu kebetulan memberikan contoh yang sangat nyaman memperkirakan p dari binomial dengan yang sebelumnya. Saya bahkan tidak tahu apakah ini yang dilakukan dalam sabermetrics, dan jika ya, saya tahu ada banyak komponen yang saya tinggalkan (pemain memiliki prior yang berbeda, penyesuaian stadion, menimbang hit baru-baru ini dibandingkan yang lama ...)
David Robinson
3
Saya terkesan bahwa bola mata Anda seakurat ini.
Dimitriy V. Masterov
Hai David, bagaimana Anda dapatkan dari nilai-nilai ini dari dan untuk nilai-nilai Anda yang terbelalak di pos tertaut masing-masing 81 dan 219? β = 3.71α=1.37β=3.71
Alex
1
@Alex Varian yang diminta dan standar deviasi berasal dari pertanyaan di atas, yang meminta SD sebesar 0,18, bukan pos distribusi beta. Jika saya menghitung alih-alih melihat bola mata, saya mungkin sudah menebak SD dari sesuatu seperti 0,03, yang akan memberi nilai 59 dan 160.
David Robinson
3

Saya ingin menambahkan ini sebagai komentar pada jawaban yang sangat bagus tetapi berjalan lama dan akan terlihat lebih baik dengan format jawaban.

Yang perlu diingat adalah bahwa tidak semua adalah mungkin. Jelas , tetapi tidak begitu jelas batasan untuk .μ [ 0 , 1 ] σ 2(μ,σ2)μ[0,1]σ2

Dengan menggunakan alasan yang sama seperti David, kita dapat mengekspresikannya

σ2(α,μ)=μ2(1-μ)α+μ

Ini menurun sehubungan dengan , jadi dapat diberikan untuk adalah:σ 2 μασ2μ

limα0σ2(α,μ)=μ(1-μ)

Ini hanya supremum karena set valid terbuka (yaitu, untuk Beta, kita harus memiliki ); batas ini dimaksimalkan sendiri pada .α > 0 μ = 1αα>0μ=12

Perhatikan hubungannya dengan RV Bernoulli yang sesuai. Distribusi Beta dengan mean , karena dipaksa untuk mengambil semua nilai antara 0 dan 1, harus kurang terdispersi (yaitu, memiliki varian lebih rendah) daripada Bernoulli RV dengan rata-rata yang sama (yang memiliki semua massanya di ujungnya) dari interval). Faktanya, mengirimkan ke 0 dan memperbaiki berarti menempatkan semakin banyak massa PDF mendekati 0 dan 1, yaitu semakin mendekati distribusi Bernoulli, itulah sebabnya supremum varians persis varian Bernoulli yang sesuai.α β = 1 - μμαβ=1-μμα

Secara keseluruhan, berikut adalah serangkaian cara dan varian yang valid untuk Beta:

masukkan deskripsi gambar di sini

(Memang ini dicatat di halaman Wikipedia untuk Beta )

MichaelChirico
sumber