Kuadrat terkecil yang digeneralisasi: dari koefisien regresi ke koefisien korelasi?

10

Untuk kuadrat terkecil dengan satu prediktor:

y=βx+ϵ

Jika dan y distandarisasi sebelum pemasangan (yaitu N ( 0 , 1 ) ), maka:xyN(0,1)

  • sama dengan koefisien korelasi Pearson, r .βr
  • sama dalam regresi yang direfleksikan: x = β y + ϵβx=βy+ϵ

Untuk generalised least square (GLS), apakah hal yang sama berlaku? Yaitu jika saya membakukan data saya, dapatkah saya memperoleh koefisien korelasi langsung dari koefisien regresi?

Dari bereksperimen dengan data, GLS yang dipantulkan mengarah ke berbagai koefisien dan juga saya tidak yakin bahwa saya percaya bahwa koefisien regresi sesuai dengan nilai yang diharapkan untuk korelasi. Saya tahu orang-orang mengutip koefisien korelasi GLS, jadi saya bertanya-tanya bagaimana mereka sampai pada mereka dan karenanya apa yang mereka maksud?β

sqrt
sumber

Jawaban:

4

Jawabannya adalah ya, koefisien regresi linier adalah korelasi prediktor dengan respons, tetapi hanya jika Anda menggunakan sistem koordinat yang benar .

Untuk melihat apa yang saya maksud, ingatlah bahwa jika dan y berpusat dan terstandarisasi, maka korelasi antara masing-masing x i dan y hanyalah produk titik x t i yx1,x2,...,xnyxsayayxsayaty . Juga, solusi kuadrat terkecil untuk regresi linier adalah

β=(XtX)-1Xty

Jika begitu terjadi bahwa (matriks identitas) kemudianXtX=saya

β=Xty

dan kami memulihkan vektor korelasi. Seringkali menarik untuk menyusun kembali masalah regresi dalam hal prediktor yang memuaskan ˜ X t ˜ X = Ix~sayaX~tX~=saya dengan menemukan kombinasi linier yang sesuai dari prediktor asli yang menjadikan hubungan ini benar (atau ekuivalen, perubahan koordinat linier); alat prediksi baru ini disebut komponen utama.

Jadi secara keseluruhan, jawaban untuk pertanyaan Anda adalah ya, tetapi hanya ketika prediktornya sendiri tidak berkorelasi . Kalau tidak, ekspresi

XtXβ=Xty

menunjukkan bahwa beta harus dicampur bersama dengan korelasi antara prediktor itu sendiri untuk memulihkan korelasi prediktor-respons.

x

x0tx=sayaxsaya=0

x0XXtX=saya

Matthew Drury
sumber