Saya menggunakan fungsi Deming yang disediakan oleh Terry T. pada utas arsip r-help ini . Saya membandingkan dua metode, jadi saya memiliki data yang terlihat seperti ini:
y x stdy stdx
1 1.2 0.23 0.67
2 1.8 0.05 0.89
4 7.5 1.13 0.44
... ... ... ...
Saya telah melakukan regresi Deming saya (juga disebut "total kuadrat regresi") dan saya mendapatkan kemiringan dan mencegat. Saya ingin mendapatkan koefisien korelasi jadi saya mulai menghitung. Saya telah memasukkan formula secara manual:
R2 <- function(coef,i,x,y,sdty){
predy <- (coef*x)+i
stdyl <- sum((y-predy)^2) ### The calculated std like if it was a lm (SSres)
Reelstdy <- sum(stdy) ### the real stdy from the data (SSres real)
disty <- sum((y-mean(y))^2) ### SS tot
R2 <- 1-(stdyl/disty) ### R2 formula
R2avecstdyconnu <- 1-(Reelstdy/disty) ### R2 with the known stdy
return(data.frame(R2, R2avecstdyconnu, stdy, Reelstdy))
}
Formula ini berfungsi dan memberi saya output.
- Yang mana dari keduanya Apakah lebih masuk akal? (Saya pribadi menganggap keduanya bias.)
- Apakah ada cara untuk mendapatkan koefisien korelasi dari total regresi kuadrat terkecil?
OUTPUT DARI REGRESI PERMINTAAN:
Call:
deming(x = Data$DS, y = Data$DM, xstd = Data$SES, ystd = Data$SEM, dfbeta = T)
Coef se(coef) z p
Intercept 0.3874572 0.2249302 3.1004680 2.806415e-10
Slope 1.2546922 0.1140142 0.8450883 4.549709e-02
Scale= 0.7906686
>
r
r-squared
deming-regression
total-least-squares
Nico Coallier
sumber
sumber
Jawaban:
Untuk menguraikan jawaban whuber di atas - Pearson akan memberikan apa yang Anda inginkan. Ini menentukan seberapa baik y berkorelasi dengan x menggunakan pendekatan yang independen dari model regresi :
gx.rma dari paket rgr akan melakukan total kuadrat terkecil dan menghitung Pearson untuk Anda (atau Anda dapat melanjutkan dengan Deming dan melakukannya secara manual).
Jadi, jawaban dasar untuk pertanyaan Anda adalah, ketika melakukan kuadrat terkecil total, lupakan R-kuadrat dan gunakan saja Pearson. Anda selalu dapat menguadratinya jika Anda menginginkan hasil antara 0 dan 1. Ini akan melakukan semua yang Anda butuhkan.
Karena itu, saya akan menguraikan sedikit karena saya mengerti rasanya kita harus dapat menghitung setara R-squared.
Pertama, mari kita coba jumlah regresi kuadrat normal pada data menggunakan lm. Perhatikan bahwa ia memberikan koefisien korelasi yang sama dengan Pearson (setelah rooting kuadrat dan hanya mengkhawatirkan besarnya, jelas).
Ini dihitung dari hasil model lm menggunakan pendekatan jumlah tradisional kuadrat
Jadi, asalkan Anda menggunakan model yang diberikan oleh lm, (Pearson) -quared dan R-squared adalah setara.
Namun, jika Anda menggunakan model dari jumlah total regresi kuadrat, dan mencoba menggunakan persamaan terakhir, Anda akan mendapatkan hasil yang sedikit berbeda. Itu jelas karena kuadrat normal dan total terkecil menggunakan fungsi minimisasi yang berbeda sehingga memberikan model dengan gradien dan intersepsi yang sedikit berbeda. (Ingat, persamaan pertama masih akan memberikan hasil yang sama karena hanya melihat data.)
Di sinilah aku digantung. Jika dua persamaan memberikan hasil yang sama ketika menggunakan model lm, maka tentunya harus ada formulasi yang setara untuk persamaan terakhir, tetapi ketika menggunakan model kuadrat terkecil total, yang juga memberikan hasil yang sama?
Saya bermain-main cepat dengan pendekatan yang berbeda menggunakan fungsi minimisasi yang sesuai (seperti yang ada di poster di sini: Koefisien penentuan regresi ortogonal ), tetapi tidak dapat menemukan cara untuk melakukannya - jika ada cara.
Mungkin kita berdua terpaku pada kenyataan bahwa Pearson dan R-kuadrat memberikan hasil yang sama ketika menggunakan sqaures paling normal - dan sama sekali tidak ada cara untuk melakukan R-kuadrat pada kuadrat terkecil total, yang akan memberikan hasil yang sama sebagai Pearson. Tetapi saya tidak cukup tahu tentang ini untuk mengatakan mengapa tidak.
sumber
Menggunakan paket "mcr"
dan menggunakan fungsi untuk menghasilkan model regresi deming Anda
dan menghasilkan plot menggunakan fungsi tersebut
Ini menampilkan korelasi momen produksi Pearson pada plot untuk model, yang memberi tahu Anda kekuatan dan arah hubungan linier antara dua variabel x, y Anda, tetapi tidak memberikan proporsi variasi yang dijelaskan.
Semoga itu bisa membantu.
sumber