Saya baru saja membaca sebuah makalah di mana penulis melakukan regresi berganda dengan dua prediktor. Nilai r-squared keseluruhan adalah 0,65. Mereka menyediakan tabel yang membagi r-kuadrat antara dua prediktor. Tabelnya terlihat seperti ini:
rsquared beta df pvalue
whole model 0.65 NA 2, 9 0.008
predictor 1 0.38 1.01 1, 10 0.002
predictor 2 0.27 0.65 1, 10 0.030
Dalam model ini, dijalankan R
menggunakan mtcars
dataset, nilai r-squared keseluruhan adalah 0,76.
summary(lm(mpg ~ drat + wt, mtcars))
Call:
lm(formula = mpg ~ drat + wt, data = mtcars)
Residuals:
Min 1Q Median 3Q Max
-5.4159 -2.0452 0.0136 1.7704 6.7466
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 30.290 7.318 4.139 0.000274 ***
drat 1.442 1.459 0.989 0.330854
wt -4.783 0.797 -6.001 1.59e-06 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 3.047 on 29 degrees of freedom
Multiple R-squared: 0.7609, Adjusted R-squared: 0.7444
F-statistic: 46.14 on 2 and 29 DF, p-value: 9.761e-10
Bagaimana saya bisa membagi nilai r-squared antara dua variabel prediktor?
Jawaban:
Anda bisa mendapatkan dua korelasi yang terpisah dan kuadratkan atau menjalankan dua model terpisah dan mendapatkan R ^ 2. Mereka hanya akan menyimpulkan jika prediktornya ortogonal.
sumber
Selain jawaban John , Anda mungkin ingin mendapatkan korelasi semi-parsial kuadrat untuk setiap prediktor.
Jika Anda mencari fungsi R ada
spcor()
dippcor
paket.Anda mungkin juga ingin mempertimbangkan topik yang lebih luas dalam mengevaluasi pentingnya variabel dalam regresi berganda (misalnya, lihat halaman ini tentang paket relaimpo ).
sumber
Saya menambahkan tag varians-dekomposisi ke pertanyaan Anda. Ini adalah bagian dari tag wiki-nya :
Salah satu metode yang umum adalah menambahkan regressor ke model satu per satu dan mencatat peningkatan ketika setiap regressor ditambahkan. Karena nilai ini tergantung pada regressor yang sudah ada dalam model, kita perlu melakukan ini untuk setiap pesanan yang memungkinkan di mana regressor dapat memasukkan model, dan kemudian rata-rata atas pesanan. Ini layak untuk model kecil tetapi menjadi penghalang komputasi untuk model besar, karena jumlah pesanan yang mungkin adalah p ! untuk prediktor p .R2 p! p
Grömping (2007, The American Statistician ) memberikan ikhtisar dan petunjuk pada literatur dalam konteks menilai kepentingan variabel.
sumber
y ~ a + b
akan sama dengany ~ b + a
, bukan? Dan ya, Anda perlu menghitung perbedaan antaray ~ a
dany ~ a + b
jugay ~ b
dany ~ a + b
, tetapi Anda tidak benar-benar harus lariy ~ b + a
, bukan? Jadi, Anda hanya perlu berlaria
a
b
y~1
y~a
b
y~b
y~a+b