Pertanyaan
Varian dari distribusi binomial negatif (NB) selalu lebih besar dari rata-rata. Ketika rata-rata sampel lebih besar dari variansnya, mencoba menyesuaikan parameter NB dengan kemungkinan maksimum atau dengan estimasi momen akan gagal (tidak ada solusi dengan parameter hingga).
Namun, ada kemungkinan bahwa sampel yang diambil dari distribusi NB memiliki rata-rata lebih besar dari varians. Berikut adalah contoh yang dapat direproduksi dalam R.
set.seed(167)
x = rnbinom(100, size=3.2, prob=.8);
mean(x) # 0.82
var(x) # 0.8157576
Ada probabilitas non-nol bahwa NB akan menghasilkan sampel yang parameternya tidak dapat diperkirakan (dengan metode kemungkinan dan momen maksimum).
- Bisakah perkiraan yang layak diberikan untuk sampel ini?
- Apa yang dikatakan teori estimasi ketika estimator tidak didefinisikan untuk semua sampel?
Tentang jawabannya
Jawaban dari @MarkRobinson dan @Yves membuat saya sadar bahwa parametrization adalah masalah utama. Kepadatan probabilitas NB biasanya ditulis sebagai
atau P(X=k)=Γ(r+k)
Di bawah parametrization pertama, estimasi kemungkinan maksimum adalah setiap kali varians sampel lebih kecil dari rata-rata, jadi tidak ada yang berguna dapat dikatakan tentang p . Di bawah yang kedua, itu adalah ( ∞ , ˉ x ) , sehingga kami dapat memberikan estimasi m yang wajar . Akhirnya, @MarkRobinson menunjukkan bahwa kita dapat memecahkan masalah nilai tak terhingga dengan menggunakan r bukannyar.
Kesimpulannya, tidak ada yang salah secara fundamental dengan masalah estimasi ini, kecuali bahwa Anda tidak selalu dapat memberikan interpretasi yang bermakna dan p untuk setiap sampel. Agar adil, idenya hadir dalam kedua jawaban. Saya memilih @MarkRobinson sebagai yang benar untuk komplemen yang dia berikan.
sumber
Jawaban:
Pada dasarnya, untuk sampel Anda, perkiraan parameter ukuran berada pada batas ruang parameter. Seseorang juga dapat mempertimbangkan reparameterisasi seperti d = size / (size + 1); ketika ukuran = 0, d = 0, ketika ukuran cenderung tak hingga, d mendekati 1. Ternyata, untuk pengaturan parameter yang Anda berikan, perkiraan ukuran tak hingga (d mendekati 1) terjadi sekitar 13% dari waktu untuk Taksiran Cox-Reid adjusted profil likelihood (APL), yang merupakan alternatif dari perkiraan MLE untuk NB (contoh ditunjukkan di sini) . Perkiraan parameter rata-rata (atau 'prob') tampaknya ok (lihat gambar, garis biru adalah nilai sebenarnya, titik merah adalah perkiraan untuk seed Anda = 167 sampel). Rincian lebih lanjut tentang teori APL ada di sini .
Jadi, saya akan mengatakan kepada 1 .: Perkiraan parameter yang layak dapat dimiliki .. size = infinity atau dispersi = 0 adalah estimasi yang masuk akal mengingat sampel. Pertimbangkan ruang parameter yang berbeda dan taksiran akan terbatas.
sumber
Properti ML adalah untuk ukuran sampel besar: dalam kondisi keteraturan, perkiraan ML terbukti ada, menjadi unik, dan cenderung ke parameter sebenarnya. Namun untuk ukuran sampel terbatas yang diberikan, estimasi ML bisa gagal ada di domain, misalnya karena maksimum tercapai pada batas. Itu juga bisa ada dalam domain yang lebih besar dari yang digunakan untuk memaksimalkan.
Demi invarian dengan parameterisasi ulang, saya percaya bahwa parameter tak terbatas dapat masuk akal dalam beberapa kasus.
sumber