Mengapa kesalahan pengukuran dalam variabel dependen tidak bias hasilnya?

10

Ketika ada kesalahan pengukuran dalam variabel independen saya mengerti bahwa hasilnya akan bias terhadap 0. Ketika variabel dependen diukur dengan kesalahan mereka mengatakan itu hanya mempengaruhi kesalahan standar tetapi ini tidak masuk akal bagi saya karena kita memperkirakan pengaruh bukan pada variabel asli tetapi pada beberapa lainnya ditambah kesalahan. Jadi bagaimana ini tidak memengaruhi estimasi? Dalam hal ini, bisakah saya juga menggunakan variabel instrumental untuk menghapus masalah ini?Y YXYY

Kucing jantan
sumber

Jawaban:

16

Ketika Anda ingin memperkirakan model sederhana seperti dan alih-alih benar, Anda hanya mengamatinya dengan beberapa kesalahan yang sedemikian rupa sehingga tidak berkorelasi dengan dan , jika Anda mundur perkiraan Anda adalah Y i ˜ Y i = Y i + ν i X ϵ ˜ Y i = α + β X i + ϵ i

Yi=α+βXi+ϵi
YiY~i=Yi+νiXϵ
Y~i=α+βXi+ϵi
ββ
β^=Cov(Y~i,Xi)Var(Xi)=Cov(Yi+νi,Xi)Var(Xi)=Cov(α+βXi+ϵi+νi,Xi)Var(Xi)=Cov(α,Xi)Var(Xi)+βCov(Xi,Xi)Var(Xi)+Cov(ϵi,Xi)Var(Xi)+Cov(νi,Xi)Var(Xi)=βVar(Xi)Var(Xi)=β
karena kovarians antara variabel acak dan konstanta ( ) adalah nol serta kovarian antara dan karena kami mengasumsikan bahwa mereka tidak berkorelasi.X i ϵ i , ν iαXiϵi,νi

Jadi Anda melihat bahwa koefisien Anda diperkirakan secara konsisten. Satu-satunya kekhawatiran adalah memberi Anda istilah tambahan dalam kesalahan yang mengurangi kekuatan tes statistik Anda. Dalam kasus kesalahan pengukuran yang sangat buruk pada variabel dependen, Anda mungkin tidak menemukan efek signifikan meskipun mungkin ada di sana. Secara umum, variabel instrumental tidak akan membantu Anda dalam hal ini karena mereka cenderung lebih tepat daripada OLS dan mereka hanya dapat membantu dengan kesalahan pengukuran dalam variabel penjelas.Y~i=Yi+νi=α+βXi+ϵi+νi

Andy
sumber
Saya punya pertanyaan sederhana di sini: bagaimana jika νi, yang merupakan kesalahan pengukuran dalam variabel dependen, dikorelasikan dengan variabel bebas minat? Saya akan membayangkan ada banyak kemungkinan bahwa ini bisa terjadi dan bias keinginan sosial dapat menjadi contoh. Jika responden survei memiliki bias keinginan sosial ketika menanggapi kuesioner variabel dependen, dan jika keinginan itu terkait dengan variabel independen, katakanlah usia atau jenis kelamin (yang bisa dibilang terkait dengan keinginan sosial), apa yang terjadi di hal endogenitas itu?
Kang Inkyu
3

Analisis regresi menjawab pertanyaan, "Apa nilai AVERAGE Y untuk mereka yang telah memberikan nilai X?" atau, dengan kata lain, "Berapa Y yang diprediksi akan berubah ON AVERAGE jika kita mengubah X dengan satu unit?" Kesalahan pengukuran acak tidak mengubah nilai rata-rata suatu variabel, atau nilai rata-rata untuk subset individu, sehingga kesalahan acak dalam variabel dependen tidak akan membiaskan estimasi regresi.

Katakanlah Anda memiliki data ketinggian pada sampel individu. Ketinggian ini diukur dengan sangat akurat, secara akurat mencerminkan perawakan sejati semua orang. Dalam sampel, rata-rata untuk pria adalah 175 cm dan rata-rata untuk wanita adalah 162 cm. Jika Anda menggunakan regresi untuk menghitung seberapa baik gender memprediksi ketinggian, Anda memperkirakan model

HEIGHT=CONSTANT+βGENDER+RESIDUAL

Jika wanita diberi kode 0 dan pria sebagai 1, adalah rata-rata wanita, atau 162 cm. Koefisien regresi menunjukkan berapa banyak perubahan ketinggian PADA RATA-RATA ketika Anda mengubah oleh satu unit (dari 0 ke 1). sama dengan 13 karena orang yang nilainya untuk adalah 0 (wanita) memiliki tinggi rata-rata 162 cm sedangkan orang yang nilai untuk adalah 1 (pria) memiliki tinggi rata-rata 175 cm; memperkirakan perbedaan rata-rata antara ketinggian pria dan wanita, yaitu 13 cm. ( mencerminkan variasi ketinggian berdasarkan gender.)β G E N D E R β G E N D E R G E N D E R β R E S I D U A LCONSTANTβGENDERβGENDERGENDERβRESIDUAL

Sekarang, jika Anda menambahkan secara acak -1 cm atau +1 cm ke ketinggian sebenarnya semua orang, apa yang akan terjadi? Individu yang tingginya sebenarnya, katakanlah, 170 cm sekarang akan dilaporkan berukuran 169 atau 171 cm. Namun, rata-rata sampel, atau subsampel apa pun, tidak akan berubah. Mereka yang tingginya sebenarnya 170 cm akan rata-rata 170 cm dalam dataset yang salah dan baru, wanita akan rata-rata 162 cm, dll. Jika Anda menjalankan kembali model regresi yang ditentukan di atas menggunakan dataset baru ini, nilai (yang diharapkan) dari tidak akan berubah karena perbedaan rata-rata antara pria dan wanita masih 13 cm, terlepas dari kesalahan pengukuran. (Kesalahan standar akan lebih besar dari sebelumnya karena varians dari variabel dependen sekarang lebih besar.)βββ

Jika ada kesalahan pengukuran dalam variabel independen dan bukan variabel dependen, akan menjadi estimasi yang bias. Ini mudah dipahami ketika Anda mempertimbangkan contoh ketinggian. Jika ada kesalahan pengukuran acak dalam variabel , beberapa pria akan salah dikodekan sebagai wanita dan sebaliknya. Efek dari ini adalah untuk mengurangi perbedaan gender yang jelas dalam tinggi, karena memindahkan laki-laki ke kelompok perempuan akan membuat rata-rata perempuan lebih besar sementara memindahkan perempuan ke kelompok laki-laki akan membuat laki-laki berarti lebih kecil. Dengan kesalahan pengukuran dalam variabel independen, akan lebih rendah dari nilai bias 13 cm. G E N D E R ββGENDERβ

Sementara saya menggunakan variabel bebas kategori ( ) untuk kesederhanaan di sini, logika yang sama berlaku untuk variabel kontinu. Misalnya, jika Anda menggunakan variabel kontinu seperti tinggi lahir untuk memprediksi tinggi orang dewasa, nilai yang diharapkan dari akan sama terlepas dari jumlah kesalahan acak dalam pengukuran tinggi orang dewasa.βGENDERβ

pengguna175057
sumber