Mengapa produk dari koefisien regresi bivariat dari garis on- dan on- sama dengan kuadrat korelasi?

11

Ada model regresi di mana dengan dan b = 0,4 , yang memiliki koefisien korelasi r = 0,60302 .a = 1,6 b = 0,4 r = 0,60302Y=a+bXa=1.6b=0.4r=0.60302

Jika dan kemudian beralih dan persamaan menjadi mana dan , ia juga memiliki nilai .Y X = c + d Y c = 0.4545 d = 0.9091 r 0.60302XYX=c+dYc=0.4545d=0.9091r0.60302

Saya berharap seseorang dapat menjelaskan mengapa juga . 0,60302(d×b)0.50.60302

Mike
sumber

Jawaban:

17

b=rSDy/SDx dan , jadi . b × d = r 2d=rSDx/SDyb×d=r2

Banyak buku teks statistik akan menyentuh ini; Saya suka Freedman et al., Statistics . Lihat juga di sini dan artikel wikipedia ini .

Karl
sumber
10

Lihatlah Tiga Belas Cara untuk Melihat Koefisien Korelasi - dan terutama cara 3, 4, 5 akan sangat menarik bagi Anda.

Ingin tahu
sumber
2
Ini mungkin seharusnya komentar. Perhatikan bahwa tautannya mati. Saya telah memperbarui tautan & memberikan kutipan lengkap. Bisakah Anda menguraikan, atau memberikan informasi tambahan sehingga ini akan tetap bernilai bahkan jika tautannya mati lagi?
gung - Reinstate Monica
2
Artikel Rodgers & Nicewander dirangkum di situs kami di stats.stackexchange.com/q/70969/22228 .
whuber
3

Ingat bahwa banyak teks pengantar mendefinisikan

Sxy=i=1n(xix¯)(yiy¯)

Kemudian dengan menetapkan sebagai kita memiliki dan demikian pula .x S x x = n i = 1 ( x i - ˉ x ) 2 S y y = n i = 1 ( y i - ˉ y ) 2yxSxx=i=1n(xix¯)2Syy=i=1n(yiy¯)2

Rumus untuk koefisien korelasi , kemiringan dari regresi on- ( Anda ) dan kemiringan dari regresi on- (Anda ) sering diberikan sebagai:y x b x y dryxbxyd

(1)r=SxySxxSyy(2)β^y on x=SxySxx(3)β^x on y=SxySyy

Kemudian mengalikan dan dengan jelas memberikan kuadrat dari :(2)(3)(1)

β^y on xβ^x on y=Sxy2SxxSyy=r2

Atau pembilang dan penyebut dari fraksi dalam , dan sering dibagi dengan atau sehingga hal-hal dibingkai dalam hal sampel atau perkiraan varians dan kovariansi. Misalnya, dari , koefisien korelasi yang diestimasi hanyalah estimasi kovarians, yang diukur dengan estimasi standar deviasi:(1)(2)(3)n(n1)(1)

(4)r=Corr^(X,Y)=Cov^(X,Y)SD(X)^SD(Y)^(5)β^y on x=Cov^(X,Y)Var(X)^(6)β^x on y=Cov^(X,Y)Var(Y)^

Kami kemudian segera menemukan dari mengalikan dan itu(5)(6)

β^y on xβ^x on y=Cov^(X,Y)2Var(X)^Var(Y)^=(Cov^(X,Y)SD(X)^SD(Y)^)2=r2

Kami mungkin sebaliknya telah mengatur ulang untuk menulis kovarians sebagai korelasi "ditingkatkan":(4)

(7)Cov^(X,Y)=rSD(X)^SD(Y)^

Kemudian dengan mengganti menjadi dan kita dapat menulis ulang koefisien regresi sebagai dan . Mengalikan ini bersama-sama juga akan menghasilkan , dan ini adalah solusi @ Karl. Menuliskan lereng dengan cara ini membantu menjelaskan bagaimana kita dapat melihat koefisien korelasi sebagai kemiringan regresi standar .(7)(5)(6)β^y on x=rSD^(y)SD^(x)β^x on y=rSD^(x)SD^(y)r2


Terakhir perhatikan bahwa dalam kasus Anda tetapi ini karena korelasi Anda positif. Jika korelasi Anda negatif, maka Anda harus mengambil akar negatif.r=bd=β^y on xβ^x on y

Untuk mengetahui apakah korelasi Anda positif atau negatif, Anda hanya perlu memperhatikan tanda (plus atau minus) dari koefisien regresi Anda - tidak masalah apakah Anda melihat -on-0 atau -on karena tanda-tanda mereka akan sama. Jadi Anda bisa menggunakan rumus: x x yyxxy

r=sgn(β^y on x)β^y on xβ^x on y

di mana adalah fungsi signum , yaitu jika kemiringan positif dan jika kemiringan negatif.+ 1 - 1sgn+11

Gegat
sumber
1
Anda mungkin menemukan jawaban saya ini menarik meskipun tidak secara eksplisit menjawab pertanyaan yang diajukan di sini.
Dilip Sarwate