Pertanyaan sederhana: Bagaimana cara menentukan distribusi lognormal dalam argumen keluarga GLM di R? Saya tidak dapat menemukan bagaimana ini dapat dicapai. Mengapa lognormal (atau eksponensial) bukan opsi dalam argumen keluarga?
Di suatu tempat di R-Archives saya membaca bahwa seseorang hanya harus menggunakan log-link untuk keluarga yang diatur ke gaussian di GLM, untuk menentukan lognormal. Namun, ini omong kosong karena ini akan sesuai dengan regresi non-linear dan R mulai meminta nilai awal.
Adakah yang tahu cara mengatur distribusi lognormal (atau eksponensial) untuk GLM?
Jawaban:
The gamlss paket memungkinkan Anda untuk menyesuaikan model aditif umum dengan kedua lognormal dan distribusi eksponensial, dan sekelompok orang lain, dengan beberapa variasi dalam fungsi link and menggunakan, jika Anda ingin, model semi atau non-parametrik berdasarkan splines dihukum. Ada beberapa makalah yang dipublikasikan tentang algoritma yang digunakan dan dokumentasi serta contoh yang ditautkan ke situs yang saya tautkan.
sumber
Mengenai pemasangan model eksponensial dengan
glm
: Ketika menggunakanglm
fungsi dengan family = Gamma kita juga harus menggunakan fasilitas pendukungsummary.glm
untuk memperbaiki parameter dispersi menjadi 1:Dan ketika saya akan tunjukkan tetapi jbowman mengalahkan saya untuk itu, paket "gamlss" menyediakan pas log-normal:
sumber
glm
, tetapi dengan matematika, ... dan jika Anda memiliki estimasi parameter, konstruksi residu adalah sepele di R. Posting pertanyaan itu di SO dengan tag [r] dan Anda pasti akan mendapat respons yang cepat.Lognormal bukanlah suatu pilihan karena distribusi log-normal tidak dalam keluarga distribusi eksponensial . Model linier umum hanya dapat sesuai distribusi dari keluarga eksponensial.
Saya kurang jelas mengapa eksponensial bukanlah suatu pilihan, karena distribusi eksponensial berada dalam keluarga eksponensial (seperti yang Anda harapkan). Perangkat lunak statistik lain yang saya kenal memungkinkan pemasangan distribusi eksponensial sebagai GLM dengan memperlakukannya sebagai kasus khusus distribusi Gamma dengan bentuk (alias skala atau dispersi) parameter tetap pada 1 daripada diperkirakan. Saya tidak bisa melihat cara memperbaiki parameter ini menggunakan
glm()
fungsi R , namun. Salah satu alternatif adalah menggunakansurvreg()
fungsi darisurvival
paket dengandist="exponential"
.sumber
Memasukkan log-normal GLM tidak ada hubungannya dengan distribusi atau opsi tautan
glm()
fungsi. Istilah "log-normal" cukup membingungkan dalam pengertian ini, tetapi berarti bahwa variabel respons terdistribusi normal (keluarga = gaussian), dan transformasi diterapkan pada variabel ini dengan cara berikut:Namun, ketika membandingkan log-normal glm ini dengan glm lain menggunakan distribusi yang berbeda (misalnya, gamma), fungsi AIC () harus diperbaiki. Adakah yang tahu alternatif untuk AIC yang salah ini (), dalam hal ini?
sumber
Coba gunakan perintah berikut:
Ini berfungsi di sini dan AIC tampaknya benar.
sumber