Metode untuk memasang model kesalahan pengukuran "sederhana"

13

Saya mencari metode yang dapat digunakan untuk memperkirakan model kesalahan pengukuran "OLS".

x i = X i + e x , i Y i = α + β X i

yi=Yi+ey,i
xi=Xi+ex,i
Yi=α+βXi

Dimana kesalahan independen normal dengan varian yang tidak diketahui dan σ 2 x . OLS "Standar" tidak akan berfungsi dalam kasus ini.σy2σx2

Wikipedia memiliki beberapa solusi yang tidak menarik - keduanya memberi Anda kekuatan untuk menganggap bahwa baik "varians ratio" atau "rasio reliabilitas"λ=σ 2 Xδ=σy2σx2 diketahui, di manaσ 2 X adalah varian dari regressor sejatiXi. Saya tidak puas dengan ini, karena bagaimana mungkin seseorang yang tidak tahu varians mengetahui rasio mereka?λ=σX2σx2+σX2σX2Xi

Ngomong-ngomong, apakah ada solusi lain selain kedua yang tidak mengharuskan saya untuk "tahu" tentang parameter?

Solusi untuk penyadapan dan kemiringan cukup baik.

probabilityislogic
sumber
artikel Wikipedia itu sendiri memberi Anda jawaban untuk pertanyaan ini. Jika Anda menganggap normalitas dari regressor "benar", maka Anda memerlukan kondisi lebih lanjut pada distribusi kesalahan. Jika regresor sejati bukan Gaussian, maka Anda memiliki harapan. Lihat Reiersol (1950) .
kardinal
juga, apa yang Anda maksud dengan "Solusi hanya untuk mencegat dan lereng baik-baik saja". Itu hanya dua parameter Anda! Atau apakah Anda berharap untuk mencoba mundur dari "benar" regresor juga?
kardinal
@cardinal - Aku berarti bahwa saya tidak terlalu peduli tentang dua parameter skala, dan seperti yang Anda katakan, "benar" regressor . Xi
probabilityislogic
Saya melihat. Itu masuk akal.
kardinal

Jawaban:

7

Ada berbagai kemungkinan yang dijelaskan oleh JW Gillard dalam An Historis Tinjauan Regresi Linier dengan Kesalahan di kedua Variabel

Jika Anda tidak tertarik dalam rincian atau alasan untuk memilih salah satu metode di atas yang lain, hanya pergi dengan sederhana, yaitu untuk menarik garis melalui pusat massa dengan kemiringan β = s y / s x , yaitu rasio deviasi standar yang diamati (membuat tanda kemiringan sama dengan tanda kovarians x dan y ); karena Anda mungkin dapat bekerja keluar, ini memberikan intercept pada y sumbu dari α = ˉ y - ß ˉ x .(x¯,y¯)β^=sy/sxxyyα^=y¯β^x¯.

Kelebihan dari pendekatan khusus ini adalah

  1. itu memberikan garis yang sama membandingkan terhadap y seperti y terhadap x ,xyyx
  2. itu skala-invarian sehingga Anda tidak perlu khawatir tentang unit,
  3. itu terletak di antara dua garis regresi linier biasa
  4. itu melintasi mereka di mana mereka saling bersilangan di pusat pengamatan, dan
  5. sangat mudah untuk dihitung.

Kemiringan adalah rata-rata geometrik dari lereng dari dua kemiringan regresi linier biasa. Ini juga yang akan Anda dapatkan jika Anda menstandarisasi pengamatan dan y , menggambar garis pada 45 ° (atau 135 ° jika ada korelasi negatif) dan kemudian mende-standarisasi garis. Dapat juga dilihat sebagai ekuivalen dengan membuat asumsi implisit bahwa varians dari dua set kesalahan sebanding dengan varians dari dua set pengamatan; sejauh yang saya tahu, Anda mengaku tidak tahu jalan mana yang salah.xy

Berikut adalah beberapa kode R untuk diilustrasikan: garis merah dalam grafik adalah regresi OLS pada X , garis biru adalah regresi OLS X pada Y , dan garis hijau adalah metode sederhana ini. Perhatikan bahwa kemiringannya harus sekitar 5.YXXY

X0 <- 1600:3600
Y0 <- 5*X0 + 700
X1 <- X0 + 400*rnorm(2001)
Y1 <- Y0 + 2000*rnorm(2001)
slopeOLSXY  <- lm(Y1 ~ X1)$coefficients[2]     #OLS slope of Y on X
slopeOLSYX  <- 1/lm(X1 ~ Y1)$coefficients[2]   #Inverse of OLS slope of X on Y
slopesimple <- sd(Y1)/sd(X1) *sign(cov(X1,Y1)) #Simple slope
c(slopeOLSXY, slopeOLSYX, slopesimple)         #Show the three slopes
plot(Y1~X1)
abline(mean(Y1) - slopeOLSXY  * mean(X1), slopeOLSXY,  col="red")
abline(mean(Y1) - slopeOLSYX  * mean(X1), slopeOLSYX,  col="blue")
abline(mean(Y1) - slopesimple * mean(X1), slopesimple, col="green")
Henry
sumber
@Henry, definisi Anda β tidak masuk akal bagi saya. Apakah ada "topi" yang hilang? β^
kardinal
{yi}{xi}σs
β^xyyxβ^yxxyβ^xy=ρ^sy/sxβ^yx=ρ^sx/syρ^xyρ^
x=by+c1/by=x/bc/byxρ^sy/sxsy/ρ^sxsy/sxyx
YX