Dari mana distribusi beta?

13

Karena saya yakin semua orang di sini sudah tahu, PDF dari distribusi Beta XB(a,b) diberikan oleh

f(x)=1B(a,b)xa1(1x)b1

Saya telah berburu di seluruh tempat untuk penjelasan tentang asal-usul formula ini, tetapi saya tidak dapat menemukannya. Setiap artikel yang saya temukan pada distribusi Beta tampaknya memberikan formula ini, menggambarkan beberapa bentuknya, kemudian langsung membahas momen-momennya dan dari sana.

Saya tidak suka menggunakan rumus matematika yang tidak bisa saya peroleh dan jelaskan. Untuk distribusi lain (misalnya gamma atau binomial) ada turunan yang jelas yang bisa saya pelajari dan gunakan. Tetapi saya tidak dapat menemukan hal seperti itu untuk distribusi Beta.

Jadi pertanyaan saya adalah: apa asal usul formula ini? Bagaimana itu dapat diturunkan dari prinsip pertama dalam konteks apa pun yang awalnya dikembangkan?

[Untuk memperjelas, saya tidak bertanya tentang bagaimana menggunakan distribusi Beta dalam statistik Bayesian, atau apa artinya secara intuitif dalam praktiknya (saya sudah membaca contoh baseball). Saya hanya ingin tahu cara menurunkan PDF. Ada pertanyaan sebelumnya yang menanyakan hal serupa, tetapi itu ditandai (saya pikir salah) sebagai duplikat dari pertanyaan lain yang tidak membahas masalah ini, jadi saya belum dapat menemukan bantuan di sini sejauh ini.]

EDIT 2017-05-06: Terima kasih semuanya atas pertanyaannya. Saya pikir penjelasan yang baik tentang apa yang saya inginkan berasal dari salah satu jawaban yang saya dapatkan ketika saya menanyakan hal ini kepada beberapa instruktur kursus saya:

"Saya kira orang dapat memperoleh kerapatan normal sebagai batas jumlah n hal yang dibagi dengan sqrt (n), dan Anda dapat memperoleh kerapatan poisson dari ide peristiwa yang terjadi dengan laju konstan. Demikian pula, untuk memperoleh kepadatan beta, Anda harus memiliki semacam ide tentang apa yang membuat sesuatu distribusi beta secara independen dari, dan secara logis sebelum, kepadatan. "

Jadi ide "ab initio" dalam komentar mungkin paling dekat dengan apa yang saya cari. Saya bukan ahli matematika, tetapi saya merasa paling nyaman menggunakan matematika yang bisa saya peroleh. Jika asal-usulnya terlalu maju untuk saya tangani, biarlah, tetapi jika tidak, saya ingin memahaminya.

Will Bradshaw
sumber
5
Berasal dari apa? Jika pendekatan binomial-konjugat-sebelumnya tidak dapat diterima, beberapa alternatif ada di sini (misalnya statistik pesanan dari variabel acak seragam, proporsi variabel Gamma).
GeoMatt22
3
Catatan: seluruh sejarah distribusi Beta disediakan di halaman Wikipedia yang tidak dapat dipercaya tentang distribusi ini, yang berisi tentang setiap detail yang mungkin!
Xi'an
1
Pertanyaan sebelumnya ditandai sebagai duplikat dari yang lain setelah OP mengklarifikasi apa yang mereka cari dalam komentar. whuber mengajukan pertanyaan yang sama seperti yang dilakukan @ Geomatt22 di sini: " Derivasi berarti koneksi logis dari sesuatu yang diasumsikan menjadi sesuatu yang akan dibangun. Apa yang ingin Anda asumsikan ?"
Scortchi
2
@ Aksakal tapi kemudian pertanyaannya terlalu luas - mungkin diturunkan dengan berbagai cara; jika Anda benar, saya akan menutupnya terlalu luas sampai pertanyaannya dipersempit menjadi sesuatu selain dari sekumpulan jawaban yang mungkin
Glen_b -Reinstate Monica
3
Beberapa diskusi singkat tentang sedikit konteks historis ada di sini (setidaknya dalam hal hubungannya dengan fungsi beta tidak lengkap). Ini memiliki koneksi ke distribusi gamma, dan banyak, banyak distribusi lain selain dan muncul cukup masuk akal dalam sejumlah cara yang berbeda; seperti yang ditunjukkan Xi'an, ia juga memiliki asal historis dalam sistem Pearson . Apa jawaban yang Anda cari di sini? Apa yang diberikan / apa yang harus diturunkan?
Glen_b -Reinstate Monica

Jawaban:

6

Sebagai mantan fisikawan, saya bisa melihat bagaimana itu bisa diturunkan. Beginilah cara fisikawan melanjutkan:

ketika mereka menemukan integral terbatas dari fungsi positif, seperti fungsi beta : mereka secara naluriah menentukan kepadatan: f ( s | x , y ) = s x - 1 ( 1 - s ) y - 1

B(x,y)=01tx1(1t)y1dt
mana0<s<1
f(s|x,y)=sx1(1s)y101tx1(1t)y1dt=sx1(1s)y1B(x,y),
0<s<1

Mereka melakukan ini untuk semua jenis integral sepanjang waktu sehingga sering terjadi secara refleks tanpa berpikir. Mereka menyebut prosedur ini "normalisasi" atau nama-nama serupa. Perhatikan bagaimana menurut definisi , kerapatan memiliki semua properti yang Anda inginkan, seperti selalu positif dan menambahkan hingga satu.

Kepadatan yang saya berikan di atas adalah dari distribusi Beta.f(t)

MEMPERBARUI

@ whuber's bertanya apa yang istimewa dari distribusi Beta sementara logika di atas dapat diterapkan pada jumlah integral yang tidak terbatas (seperti yang saya catat dalam jawaban saya di atas)?

f(x,y|s)=(y+xx)sx(1s)y

x,yss

f^(x|X)=f(X|s)f(s)01f(X|s)f(s)ds,
f(s)f(X|s)s
Aksakal
sumber
1
@ Xi'an OP tampaknya tidak tertarik pada sejarah.
Aksakal
1
"Penjelasan tentang asal-usul formula ini ... dalam konteks apa pun itu awalnya dikembangkan" terdengar seperti sejarah bagi saya :-).
Whuber
3
Saya percaya seseorang dapat tertarik pada sejarah dan prinsip pertama pada saat yang bersamaan. :-) Meskipun jawaban Anda benar secara matematis, sayangnya itu terlalu umum: seseorang dapat membuat kepadatan fungsi non-negatif dengan integral hingga. Lalu, apa yang istimewa dari keluarga distribusi khusus ini? Dengan demikian, pendekatan Anda tampaknya tidak memuaskan kedua sudut pandang tersebut.
Whuber
2
@ WillBradshaw, ya. Biasanya, kami melihat distribusi binomial sebagai fungsi dari jumlah kegagalan (atau keberhasilan) mengingat probabilitas dan jumlah percobaan sebagai parameter. Dengan cara ini distribusi yang terpisah . Namun, jika Anda melihatnya sebagai fungsi probabilitas mengingat jumlah keberhasilan dan kegagalan sebagai parameter, maka itu menjadi distribusi Beta setelah Anda skala ulang itu, distribusi kontinu , btw.
Aksakal
2
The artikel Wikipedia pada distribusi Beta jejak ke Karl Pearson, persis seperti yang disarankan oleh @ Xian. Stigler, dalam bukunya The History of Statistics: Pengukuran Ketidakpastian Sebelum 1900 , memberikan penjelasan singkat tentang derivasi Pearson menggunakan notasi modern.
whuber
15

masukkan deskripsi gambar di sini

B(a,b)menyebutkan Wallis (1616-1703), Newton (1642-1726), dan Stirling (1692-1770) berurusan dengan kasus-kasus khusus integral bahkan lebih awal. Karl Pearson (1895) pertama di katalog keluarga ini distribusi sebagai Pearson Tipe I .


F(p,q)

ϱ=σ^12/σ^22pσ^12χp2qσ^12χq2
pϱq+pϱB(p/2,q/2)
ωB(Sebuah,b)
ω/Sebuah(1-ω)/bF(2Sebuah,2b)
B(Sebuah,b)F(hal,q)
fhal,q(x){halx/q}hal/2-1(1+halx/q)-(hal+q)/2
y={px/q}{1+px/q}y(0,1)
x=qyp(1y)
dxdy=qp(1y)+qyp(1y)2=pq(1y)2
g(y)yp/21(1y)q/2+1(1y)2=yp/21(1y)q/2+1
[di mana semua konstanta normalisasi diperoleh dengan memaksakan kepadatan untuk berintegrasi ke satu.
Xi'an
sumber
2
+1. Mungkin perlu dicatat bahwa K. Pearson tidak hanya "katalog" distribusi Beta: ia mendapatkannya melalui solusi dari keluarga persamaan diferensial yang diilhami oleh hubungan yang ia amati antara persamaan perbedaan untuk Binomial dan persamaan diferensial untuk distribusi Normal. Generalisasi persamaan perbedaan Binomial ke distribusi hypergeometrik menghasilkan generalisasi persamaan diferensial, yang solusinya mencakup distribusi Beta "Tipe I" dan "Tipe II". Inilah jenis turunan ab initio yang tampaknya dicari OP.
whuber
2
Saya pikir saya bisa belajar banyak dengan mempelajari jawaban ini. Saat ini terlalu maju untuk saya, tetapi ketika saya punya waktu saya akan kembali dan meneliti topik yang Anda sebutkan, kemudian coba lagi untuk memahaminya. Terimakasih banyak. :)
Will Bradshaw
1

Pertama-tama, saya tidak bagus dalam deskripsi konsep yang tepat secara matematis di kepala saya, tetapi saya akan mencoba yang terbaik menggunakan contoh sederhana:

λ

λ=g(x)=λmSebuahx-(q|x-x0|)1q, q>0, 0λλmSebuahx
di mana x adalah jarak ke pusat target (x0). Untukq=1/2ini akan menjadi perkiraan orde pertama dari seorang Gaussian. Itu berarti bahwa Anda paling sering mengenai sasaran. Demikian pula, ia mendekati setiap kurva berbentuk lonceng, misalnya, yang dihasilkan dari difusi partikel Brown.

Sekarang, mari kita juga berasumsi bahwa seseorang benar-benar berani / bodoh mencoba menipu Anda dan menggeser target pada setiap tembakan. Dengan demikian kami membuatx0itu sendiri menjadi variabel acak. Jika distribusi gerakan orang itu dapat dijelaskan oleh (p-1) -kekuatang(x) (itu adalah P(x0)=Cg(x)hal-1)), transformasi sederhana dari variabel acak (ingat P(λ)dλ=P(x0)dx0) mengarah ke Beta yang didistribusikan λ:

P(λ)=P(g-1(λ))|dg-1(λ)dλ|=Cλhal-1(λmSebuahx-λ)q-1

di mana normalisasi konstan Cadalah fungsi beta. Untuk parametrization standar dari distribusi beta yang akan kami tetapkanλmSebuahx=1.

Dengan kata lain distribusi beta dapat dilihat sebagai distribusi probabilitas di pusat distribusi yang gugup.

Saya harap derivasi ini mendekati makna instruktur Anda. Perhatikan bahwa bentuk fungsional darig(x) dan P(x0) sangat fleksibel dan menjangkau dari segitiga seperti distribusi dan distribusi berbentuk-U (lihat contoh di bawah) hingga distribusi yang memuncak tajam.

FYI: Saya menemukan ini sebagai efek samping dalam pekerjaan doktoral saya dan melaporkannya dalam tesis saya dalam konteks kurva tuning saraf non-stasioner yang mengarah ke distribusi jumlah lonjakan lonjakan yang meningkat nol (bimodal dengan mode di nol). Menerapkan konsep yang dijelaskan di atas menghasilkan distribusi campuran Beta-Poisson untuk aktualitas saraf. Distribusi itu dapat disesuaikan dengan data. Parameter yang dipasang memungkinkan untuk memperkirakan keduanya, distribusig(x) serta distribusi jitter hal(x0)dengan menerapkan logika terbalik. Campuran Beta-Poisson adalah alternatif yang sangat menarik dan fleksibel untuk distribusi binomial negatif yang banyak digunakan (yang merupakan campuran Gamma-Poisson) untuk memodelkan penyebaran berlebih. Di bawah Anda menemukan contoh "Jitter Beta "- ide dalam aksi:

A jitter model leading to the Beta-Poisson spiking model.

A : Simulasi percobaan perpindahan 1D, diambil dari distribusi jitter di inset (P(jsayatter)g(x)hal-1). Lapangan tembak rata-rata percobaan (garis hitam solid) lebih luas dan memiliki tingkat puncak lebih rendah dibandingkan dengan kurva tuning yang mendasarinya tanpa jitter (garis biru solid, parameter yang digunakan:λmSebuahx=10,hal=.6,q=.5. B : Distribusi yang dihasilkan dariλ di x0melintasi N = 100 percobaan dan pdf analitik dari distribusi Beta. C : Simulasi penghitungan lonjakan simulasi dari proses Poisson dengan parameterλsayadi mana saya menunjukkan indeks percobaan dan distribusi Beta-Poisson yang dihasilkan seperti yang digambarkan di atas. D : Situasi analog dalam 2D ​​dengan sudut shift acak yang mengarah ke statistik yang identik.

Jojo
sumber