Apakah mungkin untuk menerapkan prosedur MLE biasa pada distribusi segitiga? - Saya mencoba tetapi saya tampaknya diblokir pada satu langkah atau yang lain dalam matematika dengan cara distribusi didefinisikan. Saya mencoba menggunakan fakta bahwa saya tahu jumlah sampel di atas dan di bawah c (tanpa mengetahui c): 2 angka ini adalah cn dan (1-c) n, jika n adalah jumlah total sampel. Namun, itu sepertinya tidak membantu dalam derivasi. Momen momen memberikan estimator untuk c tanpa banyak masalah. Apa sifat pasti dari obstruksi untuk MLE di sini (jika memang ada)?
Keterangan lebih lanjut:
Mari kita perhatikan dalam dan distribusi didefinisikan pada oleh: [ 0 , 1 ] [ 0 , 1 ]
jika x <c jika c <= x
Mari kita ambil sampel iid dari distribusi ini dari log-kemungkinan c diberikan sampel ini:{ x i }
Saya kemudian mencoba menggunakan fakta bahwa mengingat bentuk , kita tahu bahwa sampel akan jatuh di bawah (tidak diketahui) , dan akan jatuh di atas . IMHO, ini memungkinkan untuk mendekomposisi penjumlahan dalam ekspresi kemungkinan log sebagai berikut:c n c ( 1 - c ) n c
Di sini, saya tidak yakin bagaimana untuk melanjutkan. MLE akan melibatkan pengambilan turunan dari kemungkinan log, tetapi saya memiliki sebagai batas atas dari penjumlahan, yang tampaknya menghalangi itu. Saya bisa mencoba dengan bentuk lain dari kemungkinan log, menggunakan fungsi indikator:c
Tetapi menurunkan indikator juga tampaknya tidak mudah, walaupun Dirac delta dapat memungkinkan untuk melanjutkan (sementara masih memiliki indikator, karena kita perlu menurunkan produk).
Jadi, di sini saya diblokir di MLE. Ada ide?
Jawaban:
Pasti! Meskipun ada beberapa keanehan yang harus dihadapi, adalah mungkin untuk menghitung MLE dalam kasus ini.
Namun, jika dengan 'prosedur biasa' yang Anda maksudkan 'mengambil turunan dari kemungkinan log dan menetapkannya sama dengan nol', maka mungkin tidak.
Sudahkah Anda mencoba menggambar kemungkinan?
-
Tindak lanjut setelah klarifikasi pertanyaan:
Pertanyaan tentang menggambar kemungkinan bukanlah komentar kosong, tetapi penting bagi masalah ini.
Tidak. MLE melibatkan menemukan argmax suatu fungsi. Itu hanya melibatkan menemukan nol turunan dalam kondisi tertentu ... yang tidak berlaku di sini. Paling-paling, jika Anda berhasil melakukannya, Anda akan mengidentifikasi beberapa minimum lokal .
Seperti yang disarankan pertanyaan saya sebelumnya, lihat kemungkinannya.
Garis abu-abu menandai nilai data (saya mungkin harus menghasilkan sampel baru untuk mendapatkan pemisahan nilai yang lebih baik). Titik-titik hitam menandai kemungkinan / log-kemungkinan dari nilai-nilai tersebut.
Berikut adalah memperbesar mendekati kemungkinan maksimum, untuk melihat lebih detail:
Seperti yang dapat Anda lihat dari kemungkinan, di banyak statistik urutan, fungsi kemungkinan memiliki 'sudut' yang tajam - titik di mana turunannya tidak ada (yang tidak mengejutkan - pdf asli memiliki sudut dan kami mengambil produk pdf). Ini (yang ada cusps pada statistik pesanan) adalah kasus dengan distribusi segitiga, dan maksimum selalu terjadi pada salah satu statistik pesanan. (Titik puncak yang terjadi pada statistik pesanan tidak unik untuk distribusi segitiga; misalnya kepadatan Laplace memiliki sudut dan sebagai akibatnya kemungkinan untuk pusatnya memiliki satu di setiap statistik urutan.)
Seperti yang terjadi dalam sampel saya, maksimum terjadi sebagai statistik urutan keempat, 0,3780912
Referensi yang berguna adalah bab 1 " Beyond Beta " oleh Johan van Dorp dan Samuel Kotz. Seperti yang terjadi, Bab 1 adalah bab 'sampel' gratis untuk buku - Anda dapat mengunduhnya di sini .
Ada sebuah makalah kecil yang indah oleh Eddie Oliver tentang masalah ini dengan distribusi segitiga, saya pikir dalam American Statistician (yang pada dasarnya membuat poin yang sama; Saya pikir itu ada di sudut guru). Jika saya dapat mengatur untuk menemukannya, saya akan memberikannya sebagai referensi.
Edit: ini dia:
EH Oliver (1972), Keanehan Kemungkinan Maksimum,
The American Statistician , Vol 26, Edisi 3, Juni, p43-44
( tautan penerbit )
Jika Anda bisa mendapatkannya dengan mudah, ada baiknya dicoba, tetapi bab Dorp dan Kotz membahas sebagian besar masalah yang relevan sehingga tidak penting.
Dengan menindaklanjuti pertanyaan dalam komentar - bahkan jika Anda dapat menemukan beberapa cara 'melicinkan' sudut-sudut, Anda masih harus berurusan dengan fakta bahwa Anda bisa mendapatkan beberapa maxima lokal:
Namun, mungkin untuk menemukan penduga yang memiliki sifat yang sangat baik (lebih baik daripada metode momen), yang dapat Anda tuliskan dengan mudah. Tetapi ML pada triangular on (0,1) adalah beberapa baris kode.
Jika masalah jumlah data yang sangat besar, itu juga bisa diatasi, tetapi akan menjadi pertanyaan lain, saya pikir. Misalnya, tidak setiap titik data bisa maksimal, yang mengurangi pekerjaan, dan ada beberapa penghematan lain yang bisa dilakukan.
sumber