Situasi
Saya memiliki dataset dengan satu variabel dependen dan satu variabel bebas x . Saya ingin mencocokkan regresi linear piecewise berkelanjutan dengan k breakpoint diketahui / diperbaiki terjadi di ( a 1 , a 2 , ... , a k ) . Breakpoins dikenal tanpa ketidakpastian, jadi saya tidak ingin memperkirakannya. Maka saya cocok dengan regresi (OLS) dari bentuk y i = β 0 + β 1 x i + β 2 max ( x i - a 1 Berikut adalah contoh dalam
R
set.seed(123)
x <- c(1:10, 13:22)
y <- numeric(20)
y[1:10] <- 20:11 + rnorm(10, 0, 1.5)
y[11:20] <- seq(11, 15, len=10) + rnorm(10, 0, 2)
Mari kita asumsikan bahwa breakpoint terjadi di 9.6 :
mod <- lm(y~x+I(pmax(x-9.6, 0)))
summary(mod)
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 21.7057 1.1726 18.511 1.06e-12 ***
x -1.1003 0.1788 -6.155 1.06e-05 ***
I(pmax(x - 9.6, 0)) 1.3760 0.2688 5.120 8.54e-05 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Mencegat dan kemiringan dari dua segmen adalah: dan - 1,1 untuk yang pertama dan 8,5 dan 0,27 untuk yang kedua, masing-masing.
Pertanyaan
- Bagaimana cara menghitung intersep dan kemiringan setiap segmen dengan mudah? Apakah model dapat direkam ulang untuk melakukan ini dalam satu perhitungan?
- Bagaimana cara menghitung kesalahan standar setiap kemiringan dari setiap segmen?
- Bagaimana cara menguji apakah dua lereng yang berdekatan memiliki kemiringan yang sama (yaitu apakah breakpoint dapat dihilangkan)?
sumber
x
danI(pmax(x-9.6,0))
, apakah itu benar?Pendekatan naif saya, yang menjawab pertanyaan 1:
Tetapi saya tidak yakin apakah statistik (dalam derajat kebebasan tertentu) dilakukan dengan benar, jika Anda melakukannya dengan cara ini.
sumber