Perlakuan buku teks biasa penyesuaian untuk variabel berlebihan di OLS menyatakan bahwa estimator masih tidak bias, tetapi mungkin memiliki varians yang lebih besar (lihat, misalnya, Greene, Analisis Ekonometrik, edisi ke-7, hal. 58).
Suatu hari saya menemukan pengobatan Judea Pearl dari Simpson's Paradox dan halaman web yang bagus yang mensimulasikan bagaimana "dimasukkannya variabel kontrol secara bertahap ke dalam model regresi mengubah tanda perkiraan hubungan sebab akibat dalam setiap langkah". Bagi saya, ini bertentangan dengan pernyataan di atas. Saya merasa ini bisa menjadi masalah yang sangat halus (meskipun sangat penting), jadi setiap penunjuk ke literatur lebih lanjut akan sangat membantu. Yang paling mengejutkan saya adalah bahwa Greene mengklaim dia memiliki bukti untuk penilaiannya.
sumber
Pertimbangkan model regresi linier yang dipostulatkan
Sebagai soal aljabar (dan bukan asumsi stokastik), estimator OLS dalam notasi matriks adalah
Nilai yang diharapkan tergantung pada matriks regressor
Jadi: Jika "eksogenitas ketat" dari para regressor berkenaan dengan istilah error berlaku, atau, dengan kata lain, jika semua istilah error berarti independen dari semua regressor, masa lalu sekarang dan masa depan, (yang merupakan asumsi tolok ukur dalam Klasik Model Regresi Linier), yaitu jikaE( u ∣ X ) = 0 , kami akan memiliki
menggunakan juga hukum harapan yang diulang-ulang.
Dengan semua hal di atas, apa yang dimaksud dengan "variabel tak berguna"? Saya ambil, itu berarti "tidak terkait" dengan variabel dependen. Tetapi "tidak berhubungan" harus diterjemahkan sebagai "independen secara stokastik". Tetapi jika itu independen dari variabel dependen, berarti independen dari istilah kesalahan (dan juga sangat eksogen sehubungan dengan itu), jadi semua hal di atas berlaku untuk setiap variabel berlebihan juga, dan penaksir OLS tidak bias bahkan jika, katakanlah, variabelX2 adalah "berlebihan" dan model yang sebenarnya tidak mengandungnya.
Ini adalah bagaimana para ahli ekonometrika memahami masalah ini. Sekarang, dalam pengaturan yang lebih umum, "berlebihan" dapat berarti mengatakan,X2 independen dari y tergantung pada kehadiran X1 (Yang saya duga lebih dekat dengan apa yang ada dalam pikiran Pearl). Masih, selamaX2 benar-benar eksogen dengan istilah kesalahan, hasil ketidakberpihakan berlaku.
sumber