Saya tahu pertanyaan ini cukup naif dan sederhana, tetapi saya tidak tahu persis mengapa fungsi tautan kanonik sangat berguna
Apakah ini sangat berguna? Fungsi tautan menjadi kanonik sebagian besar merupakan properti matematika. Ini agak menyederhanakan matematika, tetapi dalam pemodelan Anda harus menggunakan fungsi tautan yang secara ilmiah bermakna.
Jadi, sifat tambahan apa yang dimiliki fungsi tautan kanonik?
Ini mengarah pada adanya statistik yang cukup. Itu mungkin menyiratkan estimasi yang lebih efisien, mungkin, tetapi perangkat lunak modern (seperti glm
dalam R) tampaknya tidak memperlakukan tautan kanonik secara berbeda dari tautan lain.
Ini menyederhanakan beberapa formula, sehingga perkembangan teoritis mereda. Banyak properti matematika yang bagus, lihat Apa perbedaan antara "fungsi tautan" dan "fungsi tautan kanonik" untuk GLM .
Jadi keuntungan tampaknya sebagian besar matematis dan algoritmik, tidak terlalu statistik.
Beberapa perincian lebih lanjut: Misalkan menjadi pengamatan independen dari model keluarga dispersi eksponensial
dengan harapan dan prediktor linier dengan kovariat vektor . Fungsi tautan adalah kanonik jika . Dalam kasus ini, fungsi likelihood dapat ditulis sebagai
dan dengan teorema faktorisasi kita dapat menyimpulkan bahwaY1, ... ,YnfY( y; θ , ϕ ) = exp{ ( yθ - b ( θ ) ) / a(ϕ)+c(y, ϕ ) }
EYsaya=μsayaηsaya=xTsayaβxsayaηsaya=θsayaL(β;ϕ)=exp{∑iyixTiβ−b(xTiβ)a(ϕ)+∑ic(yi,ϕ)}
∑ixiyi sudah cukup untuk .β
Tanpa merinci, persamaan yang dibutuhkan untuk IRLS akan disederhanakan. Demikian juga, pencarian google ini sebagian besar tampaknya menemukan tautan kanonik yang disebutkan dalam konteks penyederhanaan, dan tidak ada lagi alasan statistik.
Fungsi tautan kanonik menggambarkan hubungan mean-variance dalam GLM. Misalnya, variabel acak binomial memiliki fungsi tautan mana adalah prediktor linier . Perhatikan bahwa yang merupakan hubungan mean-variance yang sesuai untuk variabel acak Bernoulli. Hal yang sama berlaku untuk variabel acak Poisson, di mana fungsi tautan terbalik adalah dan di mana dalam variabel acak Poisson, variabel varians adalah rata-rata.μ=exp(ν)/(1−exp(ν)) ν XTβ ∂∂νμ=μ(1−μ) μ=exp(ν) ∂∂νμ=μ
Model linier umum memecahkan persamaan estimasi bentuk:
di mana dan . Ketika tautannya kanonik, oleh karena itu, dan fungsi estimasi adalah:D=∂∂βg(XTβ) V=var(Y) D=V
Sebagaimana dicatat dalam makalah Wedderburn 1976 tentang quasilikelihood, tautan kanonik memiliki keunggulan bahwa informasi yang diharapkan dan diamati adalah sama dan bahwa kuadrat terkecil yang berulang secara berulang setara dengan Newton-Raphson, jadi ini menyederhanakan prosedur estimasi dan estimasi varians.
sumber