Saya pernah mendengar / melihat di beberapa tempat bahwa Anda dapat mengubah set data menjadi sesuatu yang terdistribusi normal dengan mengambil logaritma masing-masing sampel, menghitung interval kepercayaan untuk data yang diubah, dan mengubah interval kepercayaan kembali menggunakan operasi terbalik (mis. naikkan 10 pangkat masing-masing untuk batas bawah dan atas, untuk ).
Namun, saya agak curiga terhadap metode ini, hanya karena metode ini tidak berfungsi untuk rata-rata itu sendiri:
Apa cara yang benar untuk melakukan ini? Jika itu tidak bekerja untuk mean itu sendiri, bagaimana mungkin itu bekerja untuk interval kepercayaan untuk mean?
confidence-interval
mean
lognormal
Vegard
sumber
sumber
Jawaban:
Ada beberapa cara untuk menghitung interval kepercayaan untuk rata-rata distribusi lognormal. Saya akan menyajikan dua metode: Bootstrap dan kemungkinan profil. Saya juga akan mempresentasikan diskusi tentang Jeffrey sebelumnya.
Bootstrap
Untuk MLE
Dalam hal ini, MLE dari(μ,σ) untuk sampel ( x1, . . . , xn) adalah
Kemudian, MLE dari mean adalah δ = exp ( μ + σ 2 / 2 ) . Dengan resampling kita dapat memperoleh sampel bootstrap dari δ dan, dengan menggunakan ini, kita dapat menghitung beberapa bootstrap interval keyakinan. Kode berikut menunjukkan cara mendapatkan ini.δ^= exp( μ^+ σ^2/ 2) δ^
R
Untuk mean sampel
Sekarang, pertimbangkan estimatorδ~= x¯ daripada MLE. Jenis penduga lain mungkin dipertimbangkan juga.
Kemungkinan profil
Untuk definisi fungsi kemungkinan dan kemungkinan profil, lihat . Menggunakan properti invarian dari kemungkinan kita bisa reparameterise sebagai berikut( μ , σ) → ( δ, σ) , di mana δ= exp( μ + σ2/ 2) dan kemudian menghitung numerik kemungkinan profil dari δ .
Fungsi ini mengambil nilai dalam( 0 , 1 ] ; interval level 0,147 memiliki perkiraan kepercayaan 95 % . Kita akan menggunakan properti ini untuk membangun interval kepercayaan untuk δ .
R
Kode berikut menunjukkan cara mendapatkan interval ini.Pada bagian ini, disajikan algoritma alternatif, berdasarkan pada pengambilan sampel Metropolis-Hastings dan penggunaan Jeffrey, untuk menghitung interval kredibilitas untukδ .
Ingat bahwa Jeffreys sebelum untuk( μ , σ) dalam model lognormal adalah
R
Perhatikan bahwa mereka sangat mirip.
sumber
Anda dapat mencoba pendekatan Bayesian dengan Jeffreys sebelumnya. Ini harus menghasilkan interval kredibilitas dengan properti pencocokan frequentist yang benar: tingkat kepercayaan interval kredibilitas dekat dengan tingkat kredibilitasnya.
sumber
Anda benar - itu rumus untuk mean geometrik, bukan mean aritmatika. Mean aritmatika adalah parameter dari distribusi normal, dan seringkali tidak terlalu berarti untuk data lognormal. Mean geometrik adalah parameter yang sesuai dari distribusi lognormal jika Anda ingin berbicara lebih bermakna tentang kecenderungan sentral untuk data Anda.
Dan Anda memang akan menghitung CI tentang mean geometrik dengan mengambil logaritma data, menghitung mean dan CI seperti biasa, dan mengubah-balik. Anda benar bahwa Anda benar-benar tidak ingin mencampur distribusi Anda dengan meletakkan CI untuk rata-rata geometris di sekitar rata-rata aritmatika .... yeowch!
sumber