Dalam R, jika saya menulis
lm(a ~ b + c + b*c)
apakah ini masih merupakan regresi linier?
Bagaimana melakukan regresi jenis lain dalam R? Saya sangat menghargai rekomendasi untuk buku teks atau tutorial?
r
regression
suprvisr
sumber
sumber
lm()
singkatan dari regresi linier. Model Anda mencakup tiga parameter (minus intersep) untukb
,,c
dan interaksinyab:c
, yang merupakan singkatanb + c + b:c
ataub*c
singkatnya (R mengikuti notasi Wilkinson untuk model statistik). Menyesuaikan Model Linear Umum (yaitu, di mana fungsi tautan bukan identitas, seperti halnya untuk model linier yang dinyatakan di atas) diminta melaluiglm()
.Jawaban:
Linear mengacu pada hubungan antara parameter yang Anda (misalnya, ) dan hasilnya (misalnya, ). Karenanya, linier, tetapi tidak. Model linier berarti bahwa estimasi Anda terhadap vektor parameter Anda dapat ditulis , di mana adalah bobot yang ditentukan oleh prosedur estimasi Anda. Model linear dapat diselesaikan secara aljabar dalam bentuk tertutup, sementara banyak model non-linear perlu diselesaikan dengan maksimalisasi numerik menggunakan komputer.y i y = e x β + ε y = e β x + ε β = Σ i w i y i { w i }β yi y=exβ+ϵ y=eβx+ϵ β^=∑iwiyi {wi}
sumber
Posting ini di minitab.com memberikan penjelasan yang sangat jelas:
Response = constant + parameter * predictor + ... + parameter * predictor
sumber
Saya akan berhati-hati dalam menanyakan ini sebagai pertanyaan "R linear regression" versus pertanyaan "linear regression". Rumus dalam R memiliki aturan yang mungkin Anda sadari atau tidak. Sebagai contoh:
http://wiener.math.csi.cuny.edu/st/stRmanual/ModelFormula.html
Dengan asumsi Anda bertanya apakah persamaan berikut ini linier:
Jawabannya adalah ya, jika Anda mengumpulkan variabel independen baru seperti:
Mengganti persamaan newv di atas ke dalam persamaan asli mungkin terlihat seperti apa yang Anda harapkan dari persamaan linear:
Sejauh referensi, Google "regresi", atau apa pun yang Anda pikir mungkin bekerja untuk Anda.
sumber
a
merupakan fungsi linier dari empat koefisien.Anda dapat menuliskan regresi linier sebagai persamaan matriks (linear).
atau jika Anda menciutkan ini:
Regresi linier ini setara dengan menemukan kombinasi linier vektor , dan yang paling dekat dengan vektor .b c b∗c a
(Ini juga memiliki interpretasi geometris sebagai menemukan proyeksi pada rentang vektor , dan . Untuk masalah dengan dua vektor kolom dengan tiga pengukuran ini masih dapat digambar sebagai angka misalnya seperti yang ditunjukkan di sini: http://www.math.brown.edu/~banchoff/gc/linalg/linalg.html )a b c b∗c
Memahami konsep ini juga penting dalam regresi non-linear. Misalnya, lebih mudah untuk menyelesaikan daripada karena parameterisasi pertama memungkinkan untuk memecahkan dan koefisien dengan teknik untuk regresi linear. y = u ( e c ( t - v ) + e d ( t - v ) ) a by=aect+bedt y=u(ec(t−v)+ed(t−v)) a b
sumber