Distribusi mana yang memiliki solusi bentuk tertutup untuk estimasi kemungkinan maksimum?

Jawaban:

25

Tanpa kehilangan umum yang cukup berarti kita dapat mengasumsikan bahwa kerapatan probabilitas (atau massa) untuk setiap pengamatan x i (dari n pengamatan) adalah sangat positif, memungkinkan kita untuk menuliskannya sebagai eksponensialf(xi)xin

f(xi)=exp(g(xi,θ))

untuk vektor parameter .θ=(θj)

Menyamakan gradien fungsi kemungkinan log ke nol (yang menemukan titik stasioner kemungkinan, di antaranya akan menjadi semua interior global maxima jika ada) memberikan seperangkat persamaan bentuk

idg(xi,θ)dθj=0,

satu untuk setiap . Untuk salah satu dari ini untuk memiliki solusi siap, kami ingin dapat memisahkan x i istilah dari θ istilah . (Segala sesuatu mengalir dari ide kunci ini, dimotivasi oleh Prinsip Kematian Matematika : lakukan sesedikit mungkin pekerjaan; pikirkan dulu sebelum menghitung; mengatasi versi mudah dari masalah sulit terlebih dahulu.) Cara paling umum untuk melakukan ini adalah dengan persamaan yang harus diambil formulirjxiθ

i(ηj(θ)τj(xi)αj(θ))=ηj(θ)iτj(xi)nαj(θ)

untuk fungsi yang diketahui , τ j , dan α j , untuk itu solusinya diperoleh dengan menyelesaikan persamaan simultanηjτjαj

nαj(θ)ηj(θ)=iτj(xi)

untuk . Secara umum ini akan sulit untuk dipecahkan, tetapi memberikan himpunan nilai ( n α j ( θ )θmemberikan informasi lengkap tentangθ, kita bisa menggunakan vektor inisebagai gantiθitu sendiri (dengan demikian agak menggeneralisasi ide solusi "bentuk tertutup", tetapi dengan cara yang sangat produktif). Dalam kasus seperti itu, mengintegrasikan sehubungan denganhasilθj(nαj(θ)ηj(θ))θ θθj

g(x,θ)=τj(x)θηj(θ)dθjθαj(θ)dθj+B(x,θj)

(di mana berarti semua komponen θ kecuali θ j ). Karena sisi kiri secara fungsional independen dari θ j , kita harus memiliki itu τ j ( x ) = T ( x ) untuk beberapa fungsi tetap T ; bahwa B tidak boleh bergantung pada θ sama sekali; dan η j adalah turunan dari beberapa fungsi H ( θ ) dan α j adalah turunan dari beberapa fungsi lainnya Aθjθθjθjτj(x)=T(x)TBθηjH(θ)αj , keduanya berfungsi secara independen dari data. Dari manaA(θ)

g(x,θ)=H(θ)T(x)A(θ)+B(x).

Kepadatan yang dapat ditulis dalam bentuk ini membentuk keluarga Koopman-Pitman-Darmois yang terkenal , atau keluarga eksponensial . Ini terdiri dari keluarga parametrik penting, baik kontinu dan diskrit, termasuk Gamma, Normal, Chi-squared, Poisson, Multinomial, dan banyak lainnya .

whuber
sumber
Dan bagi mereka yang tidak memiliki formulir tertutup, kita bisa menggunakan Algoritma EM. Sebagai contoh, perhatikan moddel poisson nol-inflated: stats.stackexchange.com/questions/32133/…
Damien
0

Saya tidak tahu apakah saya bisa mendaftar semuanya. Eksponensial, normal dan binomial muncul di pikiran dan mereka semua termasuk dalam kelas keluarga eksponensial. Keluarga eksponensial memiliki statistik yang cukup dalam eksponen dan mle sering merupakan fungsi yang baik dari statistik yang cukup ini.

Michael R. Chernick
sumber
8
Pertanyaan ini sangat luas tetapi tampaknya OP mungkin bertanya apa yang menjadi ciri distribusi yang memiliki solusi bentuk-tertutup untuk MLE daripada meminta daftar lengkap. Bagaimanapun, daftar lengkap bahkan tidak mungkin.
Makro
2
[logxlog(1-x)]T, dari mana metode numerik diperlukan untuk menemukan parameter bentuk Sebuah dan b.
Neil G
Thnaks Neil untuk menunjukkan hal itu. Saya kira tidak semua distribusi keluarga eksponensial memiliki solusi bentuk tertutup.
Michael R. Chernick