Pertimbangkan regresi sederhana (normalitas tidak diasumsikan): mana dengan mean 0 dan standar deviasi \ sigma . Apakah Estimasi Kuadrat Terkecil dari a dan b tidak berkorelasi?e i
σ a b
Pertimbangkan regresi sederhana (normalitas tidak diasumsikan): mana dengan mean 0 dan standar deviasi \ sigma . Apakah Estimasi Kuadrat Terkecil dari a dan b tidak berkorelasi?e i
Jawaban:
Ini merupakan pertimbangan penting dalam merancang eksperimen, di mana dapat diinginkan untuk tidak memiliki (atau sangat sedikit) korelasi di antara perkiraanSebuah^ dan dan b^ . Kurangnya korelasi dapat dicapai dengan mengendalikan nilai-nilai Xsaya .
Untuk menganalisis efek pada estimasi, nilai-nilai (yang merupakan vektor baris dengan panjang ) dirakit secara vertikal menjadi matriks , matriks desain, memiliki baris sebanyak data, dan (jelas ) dua kolom. sesuai dirakit menjadi satu vektor panjang (kolom) . Dalam istilah-istilah ini, menulis untuk koefisien yang dirangkai, modelnya adalah ( 1 , X i ) 2 X Y i y β = ( a , b ) ′Xsaya ( 1 , Xsaya) 2 X Ysaya y β= ( a , b )′
The yang (biasanya) diasumsikan variabel acak independen yang varians adalah konstan untuk beberapa diketahui . Pengamatan tergantung diambil menjadi salah satu realisasi dari vektor-dihargai variabel acak .σ 2 σ > 0 y YYi σ2 σ>0 y Y
Solusi OLS adalah
dengan asumsi invers matriks ini ada. Dengan demikian, menggunakan properti dasar dari perkalian matriks dan kovarian,
Matriks hanya memiliki dua baris dan dua kolom, sesuai dengan parameter model . Korelasi dengan sebanding dengan elemen-elemen off-diagonal yang oleh Peraturan Cramer sebanding dengan dot produk dari dua kolom . Karena salah satu kolom adalah semua s, yang produk dengan kolom lainnya (terdiri dari ) adalah jumlah mereka, kami menemukan (a,b) a b (X'X) - 1 ,X1Xi(X′X)−1 (a,b) a^ b^ (X′X)−1, X 1 Xi
Kondisi orthogonality ini sering dicapai dengan memasukkan kembali (dengan mengurangi rata-rata dari masing-masing). Meskipun ini tidak akan mengubah estimasi kemiringan , itu memang mengubah estimasi intersepsi . Apakah itu penting atau tidak tergantung pada aplikasi.b aXi b^ a^
Analisis ini berlaku untuk regresi berganda: matriks desain akan memiliki kolom untuk variabel independen (kolom tambahan terdiri dari s) dan akan menjadi vektor dengan panjang , tetapi jika tidak semuanya berjalan seperti sebelumnya. p 1 β p + 1p+1 p 1 β p+1
Dalam bahasa konvensional, dua kolom disebut orthogonal ketika produk titiknya nol. Ketika satu kolom (katakanlah kolom ) ortogonal ke semua kolom lainnya, itu adalah fakta aljabar yang mudah ditunjukkan bahwa semua entri off-diagonal di baris dan kolom dari adalah nol (yaitu, komponen dan untuk semua adalah nol). Karena itu,X i i i ( X ′ X ) - 1 i j j i j ≠ iX X i i i (X′X)−1 ij ji j≠i
Banyak desain eksperimental standar terdiri dari memilih nilai-nilai variabel independen untuk membuat kolom saling orthogonal. Ini "memisahkan" estimasi yang dihasilkan dengan menjamin - sebelum ada data yang dikumpulkan! - bahwa estimasi tersebut tidak berkorelasi. (Ketika respons memiliki distribusi normal, ini berarti estimasi akan independen, yang sangat menyederhanakan interpretasinya.)
sumber