Saya ingin menghitung parameter dari distribusi eksponensial dari populasi sampel yang diambil dari distribusi ini dalam kondisi bias. Sejauh yang saya tahu, untuk sampel nilai n, estimator yang biasa adalah . Namun sampel saya bias sebagai berikut:
Dari populasi lengkap elemen m yang diambil dari distribusi eksponensial, hanya n elemen terkecil yang diketahui. Bagaimana saya bisa memperkirakan parameter dalam skenario ini?
Sedikit lebih formal, jika adalah sampel pertama yang diambil dari , sehingga untuk setiap i <j kami memiliki x_i \ leq x_j , maka bagaimana saya bisa memperkirakan \ lambda dari set \ {x_1, x_2, x_3, ..., x_n \} di mana n <m .
Terima kasih banyak!
Michael
Jawaban:
Estimasi kemungkinan maksimum untuk parameter distribusi eksponensial di bawah sensor tipe II dapat diturunkan sebagai berikut. Saya berasumsi ukuran sampel adalah , dimana terkecil diamati dan terbesar tidak teramati (tetapi diketahui ada.)m n < m m - n
Mari kita asumsikan (untuk kesederhanaan notasi) bahwa diamati disusun: . Maka kepadatan probabilitas gabungan dari adalah:xsaya 0 ≤x1≤x2≤ ⋯ ≤xn x1, ... ,xn
di mana eksponensial pertama berkaitan dengan probabilitas diamati dan yang kedua dengan probabilitas yang tidak teramati yang lebih besar dari (yang hanya 1 - CDF di .) Istilah penyusunan ulang mengarah ke:n xsaya m - n xsaya xn xn
(Catat jumlah berjalan ke karena ada " " dalam koefisien .) Mengambil log, lalu turunan wrt dan seterusnya mengarah ke penaksir kemungkinan maksimum:n - 1 + 1 xn λ
sumber
Ini menghubungkan jawaban @ jbowman dengan komentar saya. Yaitu, di bawah asumsi kerja umum, seseorang dapat menggunakan 'kemungkinan bertahan hidup standar' di bawah sensor tipe II.
PS1: Perhatikan bahwa ini tidak terbatas pada distribusi eksponensial.
PS2: Detail dapat ditemukan di Bagian 2.2 buku oleh Lawless .
sumber
Dengan asumsi diketahui, estimasi dapat diperoleh vian
Logikanya adalah: jika Anda memiliki seluruh set sampel, Anda dapat membangun CDF empiris, , dari sampel ini. Kemudian jika Anda mengambil item dari array yang diurutkan ini, itu akan sesuai dengan nilai CDF . Dalam banyak kasus, adalah pilihan yang berguna.n Φ k k / n k = n / 2
sumber