Regresi linier dengan noise tembakan

8

Saya mencari terminologi statistik yang tepat untuk menggambarkan masalah berikut.

Saya ingin menandai perangkat elektronik yang memiliki respons linier

Y=β0+β1X+ϵ

di mana adalah sebuah istilah karena derau pembacaan perangkat. Untuk menentukan Saya akan mengukur serangkaian respons dan menerapkan kotak alat regresi linier standar. Tapi saya tidak tahu apa sebenarnya , karena saya menggunakan sumber yang dipengaruhi oleh suara tembakan. Itu saya tahu bahwa jika saya mengatur tombol pada sumber ke nilai tertentu maka (Gaussian dengan rata-rata dan varians ).ϵN(0,σro2)β0,β1,σro2{Xi,Yi}XiJiXiN(μ,μ)μμ

Ini terlihat seperti model kesalahan-dalam-variabel dari regresi linier ( http://en.wikipedia.org/wiki/Errors-in-variables_models ), di mana bukan karena fakta bahwa untuk mengkarakterisasi perangkat saya pada seluruh rentang inputnya , selama pengukuran saya harus mengubah nilai , dan sekarang varian tidak diperbaiki, tetapi itu tergantung pada (melalui J_i), meskipun karena suara tembakan jika ini tidak berarti bahwa varians sama dengan varians .JiXiXiXi=XjXiXj

Apa yang disebut model ini, dan adakah artikel di mana saya bisa mengetahui masalah seperti itu didekati? Atau apakah saya merumuskan dengan cara yang salah?

GVstats
sumber
Var (Xi) = μ = E (Xi)> 0. Jika ini diperbaiki maka ini akan menjadi kesalahan dalam model variabel dengan rasio varians σ / μ. Itu bukan karena μ berubah dengan Xi. Saya telah melihat model dengan varians tidak konstan dalam Y dan model dengan kesalahan dalam variabel tetapi tidak jenis model ini yang memiliki kesalahan dalam variabel dengan varians tidak konstan. Ketika varians dalam Y tidak konstan kadang-kadang dimungkinkan untuk memodelkan varians sebagai fungsi dari nilai kovariat x. Mungkin sesuatu seperti itu bisa dilakukan untuk kesalahan dalam X.2 ro
Michael R. Chernick

Jawaban:

3

Model probabilitas untuk noise tembakan tersebut adalah

XPoisson(μ),Y|XNormal(β0+β1X,σ2).

Perkiraan adalah rata-rata dan perkiraan yang baik diberikan oleh kuadrat terkecil biasa, karena nilai diasumsikan independen, terdistribusi secara identik, dan normal.μX(β0,β1)Y

Estimasi diberikan oleh OLS adalah tidak pantas di sini, meskipun, karena keacakan . Estimasi kemungkinan maksimum adalahσ2X

s2=Sxy2-2SxSySxy+Sxx(Sy2-Syy)+Sx2SyySx2-Sxx.

Dalam notasi ini, adalah nilai rata-rata , adalah rata-rata produk dari nilai dan , dll.SxXSxyXY

Kita dapat mengharapkan kesalahan estimasi standar dalam dua pendekatan (OLS, yang tidak cukup benar, dan MLE seperti yang dijelaskan di sini) berbeda . Ada berbagai cara untuk mendapatkan kesalahan standar ML: lihat referensi. Karena kemungkinan log relatif sederhana (terutama ketika distribusi Poisson didekati oleh distribusi Normal untuk besar ), kesalahan standar ini dapat dihitung dalam bentuk tertutup jika diinginkan.(μ)(μ,μ)μ


Sebagai contoh yang berhasil, saya menghasilkan nilai dari distribusi Poisson :12 X(100)

94,99,106,87,91,101,90,102,93,110,97,123

Kemudian, pengaturan , , dan , saya menghasilkan nilai sesuai :β0=3β1=1/2σ=112Y

47.4662,53.5622,54.6656,45.3592,49.0347,53.8803,48.3437,54.2255,48.4506,58.6761,50.7423,63.9922

Nilai rata-rata sama dengan , estimasi . Hasil OLS (yang identik dengan MLE dari koefisien) memperkirakan sebagai dan sebagai . Tidak mengherankan estimasi intersep, , berangkat dari nilai sebenarnya , karena nilai - nilai ini masih jauh dari aslinya. Perkiraan kemiringan, , mendekati nilai sebenarnya dari .X99,4167μβ01.24β10,514271β03Xβ10,5

Perkiraan OLS untuk , bagaimanapun, adalah , kurang dari nilai sebenarnya dari . MLE dari berhasil hingga . (Ini adalah kebetulan bahwa kedua perkiraan rendah dan bahwa MLE lebih besar dari perkiraan OLS.)σ20,7151σ20,999351

Angka

Garisnya adalah kesesuaian OLS dan estimasi kemungkinan maksimum untuk model probabilitas gabungan Poisson-Normal.

whuber
sumber