Bisakah saya mendapatkan parameter distribusi lognormal dari mean sampel & median?

8

Saya memiliki nilai rata-rata dan median untuk sampel yang diambil dari distribusi lognormal. Perhatikan bahwa ini bukan rata-rata dan median dari log variabel, meskipun tentu saja saya dapat menghitung log rata-rata dan median. Apakah ada solusi bentuk tertutup untuk μ dan σ dari informasi ini? Jika hanya ada solusi numerik, dapatkah Anda memberi tahu saya cara menemukannya, idealnya dengan R?

Saya perhatikan bahwa pertanyaan ini telah dijawab untuk memperoleh μ dan σ dari mean sampel dan varians sampel, di sini: Bagaimana cara memperkirakan parameter distribusi log-normal dari mean sampel dan varians sampel Namun, saya tidak memiliki varians sampel, hanya mean dan median.

Jika tidak ada solusi numerik bentuk-tertutup atau langsung, saya ingin tahu apakah menggunakan log mean sampel dan median, atau beberapa transformasi, akan memberikan jawaban yang masuk akal untuk sampel besar (dalam ratusan juta ).

andrewH
sumber

Jawaban:

10

Ini lebih tergantung pada apa yang Anda maksud dengan "dapatkan". Secara umum Anda tidak dapat memperoleh jumlah populasi dari informasi sampel. Namun, Anda sering dapat memperoleh taksiran, meskipun dalam hal ini taksirannya tidak terlalu bagus.

Jika memilikinya, Anda dapat dengan mudah menghitung parameter dari mean dan median populasi ; jikam~=exp(μ) adalah median populasi dan m=exp(μ+12σ2) adalah populasi yang berarti kemudian μ=catatan(m~) dan σ2=2catatan(mm~)=2(catatan(m)-catatan(m~)).

Anda juga dapat mencoba menggunakan mean sampel dan median sampel dalam beberapa jenis penduga jumlah populasi.

Jika satu - satunya hal yang Anda miliki adalah mean sampel dan median dari lognormal (x¯ dan x~ masing-masing) maka Anda setidaknya bisa menggunakan strategi yang jelas untuk mengganti jumlah populasi dengan sampel *, menggabungkan metode momen dan metode kuantil ... μ^=catatan(x~) dan σ^2=2catatan(x¯x~)=2(catatan(x¯)-catatan(x~)).

Saya percaya estimator ini akan konsisten. Namun, dalam sampel kecil ini pasti bias, dan mungkin tidak terlalu efisien, tetapi Anda mungkin tidak memiliki banyak pilihan tanpa analisis yang cukup.

Tentu saja, dalam kenyataannya, Anda tidak benar-benar tahu data Anda diambil dari distribusi lognormal - itu hanya dugaan. Namun, dalam praktiknya itu mungkin asumsi yang cukup bisa digunakan.

Idealnya seseorang akan mengerjakan distribusi gabungan dari mean sampel dan median dari lognormal, dan kemudian mencoba untuk memaksimalkan kemungkinan parameter pada distribusi bivariat tersebut; yang harus dilakukan sebaik mungkin, tetapi itu lebih merupakan masalah penelitian yang layak (layak makalah jika belum pernah dilakukan sebelumnya) daripada soal beberapa paragraf jawaban.

Orang bisa melakukan beberapa penyelidikan simulasi ke dalam sifat-sifat distribusi bersama mean sampel dan median. Sebagai contoh, pertimbangkan bahwa distribusi rasio rata-rata terhadap median harus bebas skala - fungsiσ hanya. Bahkan jika kita tidak dapat menghitungnya secara aljabar, kita dapat melihat bagaimana rasio (misalnya) berperilakuσperubahan. Seseorang kemudian dapat memilihσ yang kira-kira memaksimalkan peluang untuk mendapatkan rasio yang Anda amati (μ dapat diperkirakan dalam berbagai cara, tetapi yang jelas - log median, seperti yang disebutkan sebelumnya - tidak akan mengerikan).


* Peringatan: sangat mungkin bagi median sampel untuk melebihi rata-rata sampel. Dalam hal ini estimator sederhana yang disarankan di atas tidak membantu, karena ia mengandalkan rata-rata berada di atas median (itu akan memberikan estimasi negatif untuk parameter positif).

Glen_b -Reinstate Monica
sumber