Distribusi gamma vs. lognormal

29

Saya memiliki distribusi yang diamati secara eksperimental yang terlihat sangat mirip dengan gamma atau distribusi lognormal. Saya telah membaca bahwa distribusi lognormal adalah distribusi probabilitas entropi maksimum untuk varian acak yang rerata dan varians dari tetap. Apakah distribusi gamma memiliki sifat serupa?ln ( X )Xln(X)

OSE
sumber
2
Mengapa properti seperti itu bernilai dalam memutuskan mana yang akan menjadi model yang tepat?
Glen_b -Reinstate Monica
@ Glen_b Saya masih pemula dalam hal statistik jadi pengetahuan saya cukup mendasar. Melihat plot distribusi gamma dan lognormal, secara kualitatif mereka terlihat sangat mirip. Saya mencari perbedaan kuantitatif antara keduanya. Misalnya, apa saja contoh aplikasi fisik di mana distribusi gamma atau lognormal terjadi?
OSE
Pada kenyataannya, kemungkinan tidak pernah benar-benar terjadi; mereka model luar biasa sederhana yang kadang-kadang berguna (jika kasar) perkiraan kenyataan. Saya akan memposting jawaban yang membahas beberapa perbedaan kualitatif.
Glen_b -Reinstate Monica
1
@ glen_b: alasannya adalah bahwa jika Anda hanya mengukur statistik tersebut maka distribusi asumsi minimum adalah unik distribusi keluarga eksponensial dengan statistik yang cukup. Sedangkan distribusi apa pun mungkin merupakan model realitas yang buruk, jika seseorang tidak bebas memilih pengukuran mana yang diambil, maka ini adalah cara terbaik untuk memilih model.
Neil G
1
@ Glen_b Saya kira distribusi lognormal akan muncul dalam beberapa situasi fisik karena CLT.
Stéphane Laurent

Jawaban:

27

Adapun perbedaan kualitatif, lognormal dan gamma, seperti yang Anda katakan, sangat mirip.

Memang, dalam praktiknya mereka sering digunakan untuk memodelkan fenomena yang sama (beberapa orang akan menggunakan gamma di mana yang lain menggunakan lognormal). Keduanya, misalnya, model variasi koefisien konstan (CV untuk lognormal adalah , untuk gamma itu1/eσ21 ).1/α

[Bagaimana bisa konstan jika tergantung pada parameter, Anda bertanya? Ini berlaku ketika Anda memodelkan skala (lokasi untuk skala log); untuk lognormal, bertindak sebagai parameter skala, sedangkan untuk gamma, skala adalah parameter yang bukan parameter bentuk (atau kebalikannya jika Anda menggunakan parameterisasi bentuk-bentuk). Saya akan memanggil parameter skala untuk distribusi gamma β . Gamma GLM memodelkan rata-rata ( μ = α β ) sambil menahan α konstan; dalam hal itu μ juga merupakan parameter skala. Model dengan μ dan konstanta α atau σ yang bervariasi masing-masing akan memiliki CV yang konstan.]μβμ=αβαμμασ

Anda mungkin menemukan cara untuk melihat kepadatan log mereka , yang sering menunjukkan perbedaan yang sangat jelas.

Log dari variabel acak lognormal adalah ... normal. Ini simetris.

Log variabel acak gamma adalah condong ke kiri. Bergantung pada nilai parameter bentuk, mungkin cukup miring atau hampir simetris.

Berikut ini sebuah contoh, dengan lognormal dan gamma memiliki mean 1 dan varians 1/4. Plot atas menunjukkan kepadatan (gamma berwarna hijau, lognormal berwarna biru), dan plot yang lebih rendah menunjukkan kepadatan log:

gamma dan lognormal, densitas dan densitas log

(Memplot log dari kepadatan log juga berguna. Artinya, mengambil skala log pada sumbu y di atas)

Perbedaan ini menyiratkan bahwa gamma memiliki lebih banyak ekor di sebelah kiri, dan lebih sedikit dari ekor di sebelah kanan; Ekor lognormal paling kanan lebih berat dan ekor kirinya lebih ringan. Dan memang, jika Anda melihat kemiringan, dari lognormal dan gamma, untuk koefisien variasi yang diberikan, lognormal lebih condong ke kanan ( ) daripada gamma ( 2 CV ).CV3+3CV2CV

Glen_b -Reinstate Monica
sumber
+1. Apakah Anda tahu jika ada formula tertutup untuk kemiringan log gamma? Untuk lognormal, kemiringan log jelas nol, dan saya bertanya-tanya apakah ada ekspresi untuk gamma. Wikipedia memberikan rumus untuk mean dan varian log (gamma), tetapi tidak untuk skewness.
Amuba kata Reinstate Monica
0xν-1e-μx(dalamx)haldxhal=2,3,4hal=1Γ,ψζhalsebagai turunan dari fungsi gamma sehingga mungkin layak untuk menjadi lebih tinggi. Jadi kemiringan tentu bisa dilakukan tetapi tidak terutama "rapi". Jika Anda ingin mengejar itu saya bisa memberi Anda integral.
Glen_b -Reinstate Monica
Namun kita tidak perlu mengevaluasi kemiringan untuk melihat tandanya. Memeriksa log dari kepadatan log harus cukup untuk memastikan bahwa karena satu sisi jelas mendominasi yang lain.
Glen_b -Reinstate Monica
Glen terima kasih. Saya memutuskan untuk mempostingnya sebagai pertanyaan baru: stats.stackexchange.com/questions/312803 . Saya menghabiskan waktu mencari jawaban yang siap tetapi tidak dapat menemukannya, jadi mungkin berharga bagi masa depan untuk menuliskannya di suatu tempat yang mudah ditemukan. Mungkin lebih cocok untuk Math.SE, tapi saya lebih suka memilikinya di sini, jujur ​​saja.
Amuba kata Reinstate Monica
11

E(X)E(logX)

Untuk menjawab pertanyaan Anda tentang proses fisik yang menghasilkan distribusi ini: Distribusi lognormal muncul ketika logaritma X terdistribusi secara normal, misalnya, jika X adalah produk dari banyak faktor kecil. Jika X terdistribusi gamma, itu adalah jumlah dari banyak varian terdistribusi eksponensial. Misalnya, waktu tunggu untuk banyak acara proses Poisson.

Neil G
sumber
5
Tidak perlu "banyak" varian eksponensial untuk menjadi Gamma.
Stéphane Laurent