Katakanlah saya memiliki dua array 1 dimensi, dan sebuah 2 . Masing-masing berisi 100 poin data. a 1 adalah data aktual, dan sebuah 2 adalah model prediksi. Dalam hal ini, nilai R 2 adalah: R 2 = 1 - S S r e s Sementara itu, ini akan sama dengan nilai kuadrat dari koefisien korelasi, R 2 = ( Koefisien Korelasi ) 2
Sekarang jika saya menukar dua: a 2 adalah data aktual, dan sebuah 1 adalah model prediksi. Dari persamaan ( 2 ) , karena koefisien korelasi tidak peduli yang lebih dulu, nilai R 2 akan sama. Namun, dari persamaan ( 1 ) , S S t o t = Σ i ( y i - ˉ y ) 2 , yang R 2 nilai akan berubah, karena S S
telah berubah jika kita beralihydari suatu 1 ke sebuah 2 ; Sementara itu,S S r e s = ∑ i ( f i - ˉ y ) 2 tidak berubah.
Pertanyaan saya adalah: Bagaimana ini bisa saling bertentangan?
Edit :
Saya bertanya-tanya bahwa, apakah hubungan dalam Persamaan. (2) masih berdiri, jika itu bukan regresi linier sederhana, yaitu, hubungan antara IV dan DV tidak linier (bisa eksponensial / log)?
Akankah hubungan ini tetap ada, jika jumlah kesalahan prediksi tidak sama dengan nol?
correlation
r-squared
Shawn Wang
sumber
sumber
Jawaban:
Hal ini benar bahwa akan berubah ... tapi Anda lupa fakta bahwa jumlah regresi kotak akan berubah juga. Jadi mari kita pertimbangkan model regresi sederhana dan menunjukkan Koefisien Korelasi sebagai r 2 x y = S 2 x ySStot , di mana saya menggunakan sub-indeksxyuntuk menekankan fakta bahwaxadalah variabel independen danyadalah variabel dependen. Jelas,r2 x y tidak berubah jika Anda menukarxdengany. Kita dapat dengan mudah menunjukkan bahwaSSRxy=Syy(R2 x y ), di manaSSRxyadalah jumlah regresi kuadrat dan r2xy=S2xySxxSyy xy x y r2xy x y SSRxy=Syy(R2xy) SSRxy adalah jumlah total dari kotak di mana x adalah independen dan y adalah variabel dependen. Oleh karena itu: R 2 x y = S S R x ySyy x y manaSSExyadalah jumlah residu kuadrat yang sesuai di manaxadalah independen danyadalah variabel dependen. Perhatikan bahwa dalam hal ini, kita memilikiSSExy=b2 x y Sxxdenganb=Sxy
sumber
Salah satu cara untuk menafsirkan koefisien determinasi adalah dengan melihat itu sebagai Squared Pearson Koefisien Korelasi antara nilai-nilai yang diamati y i dan nilai-nilai pas y iR2 yi y^i .
Bukti lengkap tentang cara menurunkan koefisien determinasi R2 dari Koefisien Korelasi Kuadrat Pearson antara nilai yang diamati yi dan nilai yang dipasang y ^ i dapat ditemukan di bawah tautan berikut:
http://economictheoryblog.wordpress.com/2014/11/05/proof/
Di mata saya itu harus mudah dimengerti, cukup ikuti langkah-langkah tunggal. Saya kira melihat itu penting untuk memahami bagaimana hubungan antara dua tokoh kunci sebenarnya bekerja.
sumber
Dalam kasus regresi linier sederhana dengan hanya satu prediktor . Tetapi dalam regresi linier berganda dengan lebih dari satu prediktor, konsep korelasi antara prediktor dan respons tidak meluas secara otomatis. Formula mendapat:R2=r2=Corr(x,y)2
Kuadrat korelasi antara respons dan model linier yang dipasang.
sumber
sumber
sumber