Perkiraan ML dari distribusi eksponensial (dengan data yang disensor)

9

Dalam Analisis Kelangsungan Hidup, Anda menganggap waktu kelangsungan hidup rv untuk didistribusikan secara eksponensial. Mempertimbangkan sekarang bahwa saya memiliki x 1 , , x n "hasil" dari iid rv's X i . Hanya sebagian dari hasil ini yang sebenarnya "sepenuhnya terwujud", yaitu pengamatan yang tersisa masih "hidup".Xix1,,xnXi

Jika saya ingin melakukan estimasi ML untuk parameter tingkat dari distribusi, bagaimana saya bisa menggunakan pengamatan yang tidak disadari dengan cara yang koheren / tepat? Saya percaya mereka masih mengandung informasi yang berguna untuk estimasi.λ

Bisakah seseorang membimbing saya ke literatur tentang topik ini? Saya yakin itu ada. Namun saya kesulitan menemukan kata kunci / istilah pencarian yang bagus untuk topik tersebut.

Guy yang baik, Mike
sumber
3
Jadi, Anda mengatakan bahwa dari variabel acak yang Anda ukur, katakanlah n 1 < n pengamatan mewakili "waktu penyelesaian" (karena, variabel acak yang terkait "mati" pada waktu pengukuran), sedangkan sisanya n 2 < n pengamatan apakah panjang kelangsungan hidup dari variabel acak yang "masih hidup" pada saat pengukuran? ( n 1 + n 2 = n )nn1<nn2<nn1+n2=n
Alecos Papadopoulos
1
ini adalah model terpotong, variabel acak "hidup" terpotong pada saat pengamatan berhenti.
Xi'an
1
Lihat model Tobit untuk data terpotong dan sumber terkait (misalnya di sini ).
Richard Hardy
2
Anda tampaknya memiliki data tersensor, seperti kehidupan, di mana beberapa orang meninggal, tetapi beberapa masih hidup, taht seperti Anda hanya tahu bahwa, katakanlah, untuk beberapa konstan dikenal t i . xi>titi
kjetil b halvorsen
3
Waspadalah terhadap perbedaan yang terkadang kentara antara kedua situasi. Tidak jarang pemotongan menjadi bingung untuk menyensor, dan sebaliknya.
Alecos Papadopoulos

Jawaban:

17

Anda masih dapat memperkirakan parameter dengan menggunakan kemungkinan secara langsung. Biarkan pengamatan menjadi dengan distribusi eksponensial dengan laju λ > 0 dan tidak diketahui. Fungsi kerapatan adalah f ( x ; λ ) = λ e - λ x , fungsi distribusi kumulatif F ( x ; λ ) = 1 - e - λ x dan fungsi ekor G ( x ; λx1,,xnλ>0f(x;λ)=λeλxF(x;λ)=1eλx . Asumsikan r pengamatanpertamasepenuhnya diamati, sedangkan untuk x r + 1 , ... , x n kita hanya tahu bahwa x j > t j untuk beberapa konstanta positif yang diketahui t j . Seperti biasa, kemungkinannya adalah "probabilitas data yang diamati", untuk pengamatan yang disensor, yang diberikan oleh P ( X j > t jG(x;λ)=1F(x;λ)=eλxrxr+1,,xnxj>tjtj , jadi fungsi kemungkinan penuh adalah L ( λ ) = r i = 1 f ( x i ; λ ) n i = r + 1 G ( t j ; λ ) Loglikelihood fungsi kemudian menjadi l ( λ ) = r log λ - λ ( xP(Xj>tj)=G(tj;λ)

L(λ)=i=1rf(xi;λ)i=r+1nG(tj;λ)
yang memiliki bentuk yang sama dengan kemungkinan log untuk kasus yang diamati secara penuh, kecuali dari istilah r log pertama λ sebagai ganti n log λ . Menulis T untuk rata-rata observasi dan menyensor kali, estimator maksimum kemungkinan λ menjadi λ = r
l(λ)=rlogλλ(x1++xr+tr+1++tn)
rlogλnlogλTλ , yang Anda sendiri dapat membandingkannya dengan kasus yang diamati sepenuhnya.λ^=rnT
 EDIT   

r=0

l(λ)=nTλ
λλ=0λλ

Tetapi, bagaimanapun, kesimpulan nyata dari data dalam kasus itu adalah bahwa kita harus menunggu lebih banyak waktu sampai kita mendapatkan beberapa peristiwa ...

λeλnTpnp[p¯,1]λlogp=λT

p

P(X=n)=pn0.95    (say)
nlogplog0.95λ
λlog0.95nT.
kjetil b halvorsen
sumber
1
xj>tj