Regresi linier dengan kesalahan Laplace

9

Pertimbangkan model regresi linier: mana \ varepsilon _i \ sim \ mathcal L (0, b) , yaitu , Distribusi Laplace dengan 0 mean dan parameter skala b , semuanya saling independen. Pertimbangkan estimasi kemungkinan maksimum untuk parameter yang tidak diketahui \ boldsymbol \ beta : - \ log p (\ mathbf y \ mid \ mathbf X, \ boldsymbol \ beta, b) = n \ log (2b) + \ frac 1b \ sum _ {i = 1} ^ n | \ mathbf x_i \ cdot \ boldsymbol \ beta - y_i | dari mana \ hat {\ boldsymbol \ beta} _ {\ mathrm {ML}} = {\ arg \ min} _ {\ boldsymbol \ beta \ dalam \ mathbb R ^ m} \ jumlah _ {i = 1} ^ n | \ mathbf x_i \ cdot \ boldsymbol \ beta - y_i |

yi=xiβ+εi,i=1,,n,
εiL(0,b)0bβ
logp(yX,β,b)=nlog(2b)+1bi=1n|xiβyi|
β^ML=argminβRmi=1n|xiβyi|

Bagaimana seseorang dapat menemukan distribusi residu yXβ^ML dalam model ini?

nmerci
sumber
Apa yang Anda maksud dengan menemukan distribusi residu?
jlimahaverford
Karena residu dapat dikelompokkan dalam vektor acak, saya ingin mengetahui distribusinya. Setidaknya dua momen pertama.
nmerci
Terima kasih, terima kasih! Sudahkah Anda mempertimbangkan untuk mensimulasikan dan merencanakan?
jlimahaverford
Ya, saya ingin membangun wilayah kepercayaan untuk residu. Misalnya, untuk kesalahan Gaussian, wilayah tersebut adalah ellipsoid.
nmerci

Jawaban:

1

Sisa (sebenarnya disebut kesalahan) diasumsikan didistribusikan secara acak dengan distribusi eksponensial ganda (distribusi Laplace). Jika Anda memasang titik data x dan y ini, lakukan secara numerik. Anda pertama-tama menghitung beta-hat_ML untuk poin-poin ini secara keseluruhan menggunakan rumus yang Anda pasang di atas. Ini akan menentukan garis melalui titik-titik. Kemudian kurangi nilai y setiap titik dari nilai y garis pada nilai x itu. Ini adalah sisa untuk titik itu. Residu dari semua poin dapat digunakan untuk membuat histogram yang akan memberi Anda distribusi residu.

Ada artikel matematika yang bagus di dalamnya oleh Yang (2014) .

--Lee

Lee G
sumber
4
Tautan tidak berfungsi.
Michael R. Chernick