MLE untuk distribusi segitiga?

12

Apakah mungkin untuk menerapkan prosedur MLE biasa pada distribusi segitiga? - Saya mencoba tetapi saya tampaknya diblokir pada satu langkah atau yang lain dalam matematika dengan cara distribusi didefinisikan. Saya mencoba menggunakan fakta bahwa saya tahu jumlah sampel di atas dan di bawah c (tanpa mengetahui c): 2 angka ini adalah cn dan (1-c) n, jika n adalah jumlah total sampel. Namun, itu sepertinya tidak membantu dalam derivasi. Momen momen memberikan estimator untuk c tanpa banyak masalah. Apa sifat pasti dari obstruksi untuk MLE di sini (jika memang ada)?

Keterangan lebih lanjut:

Mari kita perhatikan dalam dan distribusi didefinisikan pada oleh: [ 0 , 1 ] [ 0 , 1 ]c[0,1][0,1]

f(x;c)=2xc jika x <c jika c <= x
f(x;c)=2(1-x)(1-c)

Mari kita ambil sampel iid dari distribusi ini dari log-kemungkinan c diberikan sampel ini:{ x i }n{xsaya}

l^(c|{xsaya})=saya=1nln(f(xsaya|c))

Saya kemudian mencoba menggunakan fakta bahwa mengingat bentuk , kita tahu bahwa sampel akan jatuh di bawah (tidak diketahui) , dan akan jatuh di atas . IMHO, ini memungkinkan untuk mendekomposisi penjumlahan dalam ekspresi kemungkinan log sebagai berikut:c n c ( 1 - c ) n cfcnc(1-c)nc

l^(c|{xsaya})=saya=1cnln2xsayac+saya=1(1-c)nln2(1-xsaya)1-c

Di sini, saya tidak yakin bagaimana untuk melanjutkan. MLE akan melibatkan pengambilan turunan dari kemungkinan log, tetapi saya memiliki sebagai batas atas dari penjumlahan, yang tampaknya menghalangi itu. Saya bisa mencoba dengan bentuk lain dari kemungkinan log, menggunakan fungsi indikator:ccc

l^(c|{xsaya})=saya=1n{xsaya<c}ln2xsayac+saya=1n{c<=xsaya}ln2(1-xsaya)1-c

Tetapi menurunkan indikator juga tampaknya tidak mudah, walaupun Dirac delta dapat memungkinkan untuk melanjutkan (sementara masih memiliki indikator, karena kita perlu menurunkan produk).

Jadi, di sini saya diblokir di MLE. Ada ide?

jujur
sumber
Jika ini untuk beberapa subjek, harap tambahkan tag belajar sendiri. Jika tidak, harap jelaskan bagaimana masalahnya muncul.
Glen_b -Reinstate Monica
Terima kasih atas pembaruannya; itu membuatnya jauh lebih mudah untuk mengatakan hal-hal yang masuk akal sebagai jawaban, karena itu sangat mengurangi ruang lingkup kasus untuk ditangani. Bisakah Anda mempertimbangkan komentar saya sebelumnya. Entah ini termasuk dalam tag belajar sendiri atau tidak, dalam kedua kasus saya telah bertanya apakah Anda akan melakukan sesuatu.
Glen_b -Reinstate Monica
Ini bukan untuk pekerjaan rumah atau kelas. Itu muncul pada pekerjaan saya. Kami memiliki penaksir lain dari metode momen, tetapi saya mencoba untuk mendapatkan pemahaman yang lebih dalam tentang apa yang terjadi dengan MLE di sini.
Frank
Baik; itu memberi saya lebih banyak waktu luang. Lihat jawaban saya yang diperbarui. Saya mungkin akan membuat tambahan lebih lanjut segera
Glen_b -Reinstate Monica
Referensi / tautan yang
ditambahkan

Jawaban:

10

Apakah mungkin untuk menerapkan prosedur MLE biasa pada distribusi segitiga?

Pasti! Meskipun ada beberapa keanehan yang harus dihadapi, adalah mungkin untuk menghitung MLE dalam kasus ini.

Namun, jika dengan 'prosedur biasa' yang Anda maksudkan 'mengambil turunan dari kemungkinan log dan menetapkannya sama dengan nol', maka mungkin tidak.

Apa sifat pasti dari obstruksi untuk MLE di sini (jika memang ada)?

Sudahkah Anda mencoba menggambar kemungkinan?

-

Tindak lanjut setelah klarifikasi pertanyaan:

Pertanyaan tentang menggambar kemungkinan bukanlah komentar kosong, tetapi penting bagi masalah ini.

MLE akan melibatkan pengambilan turunan

Tidak. MLE melibatkan menemukan argmax suatu fungsi. Itu hanya melibatkan menemukan nol turunan dalam kondisi tertentu ... yang tidak berlaku di sini. Paling-paling, jika Anda berhasil melakukannya, Anda akan mengidentifikasi beberapa minimum lokal .

Seperti yang disarankan pertanyaan saya sebelumnya, lihat kemungkinannya.

y

0.5067705 0.2345473 0.4121822 0.3780912 0.3085981 0.3867052 0.4177924
0.5009028 0.8420312 0.2588613

ckemungkinan untuk puncak segitiga

log-kemungkinan untuk puncak segitiga

Garis abu-abu menandai nilai data (saya mungkin harus menghasilkan sampel baru untuk mendapatkan pemisahan nilai yang lebih baik). Titik-titik hitam menandai kemungkinan / log-kemungkinan dari nilai-nilai tersebut.

Berikut adalah memperbesar mendekati kemungkinan maksimum, untuk melihat lebih detail:

Detail kemungkinan

Seperti yang dapat Anda lihat dari kemungkinan, di banyak statistik urutan, fungsi kemungkinan memiliki 'sudut' yang tajam - titik di mana turunannya tidak ada (yang tidak mengejutkan - pdf asli memiliki sudut dan kami mengambil produk pdf). Ini (yang ada cusps pada statistik pesanan) adalah kasus dengan distribusi segitiga, dan maksimum selalu terjadi pada salah satu statistik pesanan. (Titik puncak yang terjadi pada statistik pesanan tidak unik untuk distribusi segitiga; misalnya kepadatan Laplace memiliki sudut dan sebagai akibatnya kemungkinan untuk pusatnya memiliki satu di setiap statistik urutan.)

Seperti yang terjadi dalam sampel saya, maksimum terjadi sebagai statistik urutan keempat, 0,3780912

cc

Referensi yang berguna adalah bab 1 " Beyond Beta " oleh Johan van Dorp dan Samuel Kotz. Seperti yang terjadi, Bab 1 adalah bab 'sampel' gratis untuk buku - Anda dapat mengunduhnya di sini .

Ada sebuah makalah kecil yang indah oleh Eddie Oliver tentang masalah ini dengan distribusi segitiga, saya pikir dalam American Statistician (yang pada dasarnya membuat poin yang sama; Saya pikir itu ada di sudut guru). Jika saya dapat mengatur untuk menemukannya, saya akan memberikannya sebagai referensi.

Edit: ini dia:

EH Oliver (1972), Keanehan Kemungkinan Maksimum,
The American Statistician , Vol 26, Edisi 3, Juni, p43-44

( tautan penerbit )

Jika Anda bisa mendapatkannya dengan mudah, ada baiknya dicoba, tetapi bab Dorp dan Kotz membahas sebagian besar masalah yang relevan sehingga tidak penting.


Dengan menindaklanjuti pertanyaan dalam komentar - bahkan jika Anda dapat menemukan beberapa cara 'melicinkan' sudut-sudut, Anda masih harus berurusan dengan fakta bahwa Anda bisa mendapatkan beberapa maxima lokal:

dua maks lokal

Namun, mungkin untuk menemukan penduga yang memiliki sifat yang sangat baik (lebih baik daripada metode momen), yang dapat Anda tuliskan dengan mudah. Tetapi ML pada triangular on (0,1) adalah beberapa baris kode.

Jika masalah jumlah data yang sangat besar, itu juga bisa diatasi, tetapi akan menjadi pertanyaan lain, saya pikir. Misalnya, tidak setiap titik data bisa maksimal, yang mengurangi pekerjaan, dan ada beberapa penghematan lain yang bisa dilakukan.

Glen_b
sumber
Terima kasih - Saya akan mencoba memposting upaya saya yang gagal, menunjukkan distribusi apa yang sebenarnya saya bicarakan dan di mana saya pikir saya diblokir.
Frank
Terimakasih untuk penjelasan detilnya! Saya punya ide lain: seandainya saya bisa menemukan keluarga fungsi yang menyatu dengan distribusi segitiga, tetapi tidak akan terpisah-pisah - dapatkah saya menggunakannya untuk memperoleh MLE secara analitis, kemudian mengambil batas dan menganggap saya akan memiliki MLE satu distribusi segitiga itu sendiri?
Frank
Mungkin - saya pikir itu mungkin tergantung pada proses batas tertentu yang Anda gunakan ... dan Anda mungkin masih akan mendapatkan beberapa maxima lokal sehingga mungkin hanya menyelamatkan Anda mengevaluasi kemungkinan mendekati statistik urutan ekstrim - tetapi bahkan jika itu berhasil, mengapa Anda bahkan mencoba melakukan sesuatu yang begitu rumit? Apa yang salah dengan ML pada distribusi segitiga? Ini sangat sederhana untuk dilakukan dalam praktek.
Glen_b -Reinstate Monica
2
Saya harus mengatakan, MLE untuk c ini berdasarkan statistik pesanan cukup bagus, walaupun derivasi pada bab di atas membutuhkan beberapa pekerjaan (meskipun tidak terlalu sulit) - ilustrasi yang bagus bahwa esensi MLE ada dalam argmax (tentu saja!), daripada turunan (seperti yang Anda tunjukkan, dan saya sepenuhnya setuju, terpikir oleh saya untuk bekerja di hulu dari langkah turunan "biasa" (yaitu hanya khawatir tentang memaksimalkan, dengan cara apa pun), tetapi saya tidak mengejar).
Frank
1
xsaya