Bagaimana membandingkan dua kemiringan regresi untuk satu prediktor pada dua hasil yang berbeda?

10

Saya perlu membandingkan dua kemiringan regresi di mana:

$
y_1 ~ a + b_1x
y_2 ~ a + b_2x
$

Bagaimana saya bisa membandingkan b1 dan b2?

Atau dalam bahasa contoh khusus saya di hewan pengerat, saya ingin membandingkan

antero-posterior diameter ~  a + b1 * humeral length   
de naso-occipital length  ~  a + b2 * humeral length 
Dra. Alejandra Echeverria
sumber
2
Hitung model regresi dengan kedua variabel tersebut PLUS interaksi kedua variabel (panjang humerus diameter antero-posterior). Interaksi menguji asumsi paralelisme lereng dari dua variabel. Jika istilah interaksi signifikan, lerengnya berbeda. ×
COOLSerdash
Terima kasih!! Tetapi panjang humerus dan diameter antero-posterior humerus adalah DV dan panjang naso-oksipital adalah IV. Bisakah saya menjalankan analisis seperti yang Anda sarankan?
Dra.
1
@ Dra.AlejandraEcheverria Maksud Anda memiliki satu model regresi linier dengan dua variabel independen dan Anda ingin menguji kesetaraan dua koefisien pada variabel independen, atau, Anda memiliki dua model regresi linier sederhana dan Anda ingin membandingkan koefisien di kedua model?
Graeme Walsh
1
Dear @Graeme Walsh, saya punya dua model regresi linier sederhana dan saya ingin membandingkan koefisien di kedua model.
Dra.

Jawaban:

11

Oke, mari kita lihat situasi Anda. Pada dasarnya Anda memiliki dua regresi (APD = diameter antero-posterior, NOL = panjang naso-oksipital, HL = panjang humerus):

  1. APD=β0,1+β1,1NOL
  2. HL=β0,2+β1,2NOL

Untuk menguji hipotesis , Anda dapat melakukan hal berikut:β1,1=β1,2

  1. Buat variabel dependen baru ( ) hanya dengan menambahkan APD ke HLYnew
  2. Buat variabel independen baru dengan menambahkan NOL ke dirinya sendiri ( ) (yaitu menduplikasi NOL)Xnew
  3. Buat variabel dummy ( ) yaitu 1 jika data berasal dari dataset kedua (dengan HL) dan 0 jika data berasal dari dataset pertama (APD).D
  4. Hitung regresi dengan sebagai variabel dependen, dan efek utama serta interaksi antara dan variabel dummy sebagai variabel penjelas. EDIT @Jake Westfall menunjukkan bahwa kesalahan standar residual dapat berbeda untuk dua regresi untuk setiap DV. Jake memberikan jawaban yang sesuai dengan model kuadrat terkecil umum (GLS) yang memungkinkan kesalahan standar residual berbeda antara dua regresi. X n e w DYnewXnewD

Mari kita lihat contoh dengan data buatan (dalam R):

# Create artificial data

library(nlme) # needed for the generalized least squares

set.seed(1500)

NOL <- rnorm(10000,100,12)
APD <- 10 + 15*NOL+ rnorm(10000,0,2)
HL <- - 2  - 5*NOL+ rnorm(10000,0,3) 

mod1 <- lm(APD~NOL)
mod1

Coefficients:
(Intercept)          NOL
      10.11        15.00

mod2 <- lm(HL~NOL)
mod2

Coefficients:
(Intercept)          NOL
      -1.96        -5.00

# Combine the dependent variables and duplicate the independent variable

y.new <- c(APD, HL)
x.new <- c(NOL, NOL)

# Create a dummy variable that is 0 if the data are from the first data set (APD) and 1 if they are from the second dataset (HL)

dummy.var <- c(rep(0, length(APD)), rep(1, length(HL)))

# Generalized least squares model allowing for differend residual SDs for each regression (strata of dummy.var)

gls.mod3 <- gls(y.new~x.new*dummy.var, weights=varIdent(form=~1|dummy.var))

Variance function:
 Structure: Different standard deviations per stratum
 Formula: ~1 | dummy.var 
 Parameter estimates:
       0        1 
1.000000 1.481274 

Coefficients:
                    Value  Std.Error   t-value p-value
(Intercept)      10.10886 0.17049120    59.293       0
x.new            14.99877 0.00169164  8866.430       0
dummy.var       -12.06858 0.30470618   -39.607       0
x.new:dummy.var -19.99917 0.00302333 -6614.939       0

Catatan: Intersep dan kemiringan untuk persis sama seperti pada regresi pertama (mod1). Koefisien menunjukkan perbedaan antara intersepsi dari dua regresi. Selanjutnya: standar deviasi residual dari regresi kedua diperkirakan lebih besar dari SD yang pertama (sekitar 1,5 kali lebih besar). Ini adalah persis apa yang kami tentukan dalam pembuatan data (2 vs. 3). Kita hampir sampai: Koefisien dari istilah interaksi ( ) menguji kesetaraan lereng. Di sini kemiringan regresi kedua (mod2) adalah tentang atau sekitar . Perbedaan β x . n e w - β x . n e w × d u m m y . v a r 15 - 20 = - 5 20Xnewdummy.varx.new:dummy.varβx.newβx.new×dummy.var1520=520persis seperti yang kami tentukan saat kami menghasilkan data. Jika Anda bekerja di Stata, ada penjelasan yang bagus di sini.

Peringatan: Ini hanya berfungsi jika diameter antero-posterior dan panjang naso-oksipital (dua variabel dependen) independen. Kalau tidak, itu bisa sangat rumit.

EDIT

Dua posting di situs ini menangani pertanyaan yang sama: Pertama dan kedua .

rev COOLSerdash
sumber
Hanya untuk menghindari kebingungan, sepertinya Anda sudah mencampuradukkan NOL dan HL. HL adalah prediktornya, NOL adalah DV kedua (dan APD adalah DV pertama, seperti yang Anda tunjukkan). Meskipun saya baru saja memperhatikan bahwa poster itu sendiri mengubah status variabel-variabelnya dalam komentar ...
Patrick Coulombe
@ Patrick Coulombe Terima kasih telah menunjukkannya. Tidak jelas dari komentarnya kemarin.
COOLSerdash
@ Patrickrickoul Pada pemikiran kedua: Saya pikir Jeromy Anglim salah memahami komentar Alejandra dan bertukar variabel.
COOLSerdash
1
Solusi ini tampaknya masuk akal, tetapi saya sedikit khawatir tentang fakta bahwa dalam model gabungan / interaktif Anda, varian residual diasumsikan sama pada kedua tingkat dummy.var, yaitu, untuk kedua DV. Bergantung pada apa DV dalam konteks asli, ada kemungkinan varians residual berbeda secara radikal dalam regresi terpisah dari masing-masing DV. Saya bertanya-tanya apakah akan lebih baik menggunakan pendekatan dasar yang sama yang Anda usulkan, tetapi dengan glsmodel di mana kami memperkirakan varian residu yang berbeda untuk setiap DV. Ada pemikiran tentang ini?
Jake Westfall
1
@COOLSerdash Tentu, akan terlihat seperti ini:library(nlme); mod4 <- gls(y.new~x.new*dummy.var, weights=varIdent(form= ~1 | dummy.var))
Jake Westfall