Ini mungkin pertanyaan dasar, tapi saya bertanya-tanya mengapa nilai dalam model regresi dapat dikuadratkan untuk memberikan gambaran varian yang dijelaskan?
Saya mengerti bahwa koefisien dapat memberikan kekuatan suatu hubungan, tetapi saya tidak mengerti bagaimana hanya mengkuadratkan nilai ini memberikan ukuran perbedaan yang dijelaskan.
Adakah penjelasan mudah tentang ini?
Terima kasih banyak telah membantu dengan ini!
regression
correlation
r-squared
David
sumber
sumber
Jawaban:
Tangan-wavingly, korelasi dapat dianggap sebagai ukuran sudut antara dua vektor, yang tergantung vektor Y dan vektor independen X . Jika sudut antara vektor adalah θ , korelasi R adalah cos ( θ ) . Bagian Y yang dijelaskan oleh X adalah panjang | | Y | | cos ( θ ) dan sejajar dengan X (atau proyeksi Y pada X ). Bagian yang tidak dijelaskan panjangnyaR Y X θ R cos(θ) Y X ||Y||cos(θ) X Y X dan orthogonal untuk X . Dalam hal varian, kita memiliki
σ 2 Y = σ 2 Y cos 2 ( θ ) + σ 2 Y sin 2 ( θ ) di
mana istilah pertama di sebelah kanan adalah varian yang dijelaskan dan yang kedua adalah varian yang tidak dapat dijelaskan. Fraksi yang dijelaskan demikian R 2 , tidak R .||Y||sin(θ) X
sumber