Saya mencari metode yang dapat digunakan untuk memperkirakan model kesalahan pengukuran "OLS".
x i = X i + e x , i Y i = α + β X i
Dimana kesalahan independen normal dengan varian yang tidak diketahui dan σ 2 x . OLS "Standar" tidak akan berfungsi dalam kasus ini.
Wikipedia memiliki beberapa solusi yang tidak menarik - keduanya memberi Anda kekuatan untuk menganggap bahwa baik "varians ratio" atau "rasio reliabilitas"λ=σ 2 X diketahui, di manaσ 2 X adalah varian dari regressor sejatiXi. Saya tidak puas dengan ini, karena bagaimana mungkin seseorang yang tidak tahu varians mengetahui rasio mereka?
Ngomong-ngomong, apakah ada solusi lain selain kedua yang tidak mengharuskan saya untuk "tahu" tentang parameter?
Solusi untuk penyadapan dan kemiringan cukup baik.
sumber
Jawaban:
Ada berbagai kemungkinan yang dijelaskan oleh JW Gillard dalam An Historis Tinjauan Regresi Linier dengan Kesalahan di kedua Variabel
Jika Anda tidak tertarik dalam rincian atau alasan untuk memilih salah satu metode di atas yang lain, hanya pergi dengan sederhana, yaitu untuk menarik garis melalui pusat massa dengan kemiringan β = s y / s x , yaitu rasio deviasi standar yang diamati (membuat tanda kemiringan sama dengan tanda kovarians x dan y ); karena Anda mungkin dapat bekerja keluar, ini memberikan intercept pada y sumbu dari α = ˉ y - ß ˉ x .(x¯,y¯) β^=sy/sx x y y α^=y¯−β^x¯.
Kelebihan dari pendekatan khusus ini adalah
Kemiringan adalah rata-rata geometrik dari lereng dari dua kemiringan regresi linier biasa. Ini juga yang akan Anda dapatkan jika Anda menstandarisasi pengamatan dan y , menggambar garis pada 45 ° (atau 135 ° jika ada korelasi negatif) dan kemudian mende-standarisasi garis. Dapat juga dilihat sebagai ekuivalen dengan membuat asumsi implisit bahwa varians dari dua set kesalahan sebanding dengan varians dari dua set pengamatan; sejauh yang saya tahu, Anda mengaku tidak tahu jalan mana yang salah.x y
Berikut adalah beberapa kode R untuk diilustrasikan: garis merah dalam grafik adalah regresi OLS pada X , garis biru adalah regresi OLS X pada Y , dan garis hijau adalah metode sederhana ini. Perhatikan bahwa kemiringannya harus sekitar 5.Y X X Y
sumber