Apa itu 'koefisien alias'?

24

Saat membangun model regresi dalam R ( lm), saya sering mendapatkan pesan ini

"there are aliased coefficients in the model"

Apa sebenarnya artinya?

Juga, karena ini predict()juga memberi peringatan.

Meskipun ini hanya peringatan, saya ingin tahu bagaimana kita bisa mendeteksi / menghapus koefisien alias sebelum membangun model.

Juga, apa konsekuensi yang mungkin timbul dari mengabaikan peringatan ini?

Mohit Verma
sumber

Jawaban:

32

Saya menduga ini bukan kesalahan lm, melainkan vif(dari paket car). Jika demikian, saya yakin Anda telah mengalami multikolinieritas sempurna . Contohnya

x1 <- rnorm( 100 )
x2 <- 2 * x1
y <- rnorm( 100 )
vif( lm( y ~ x1 + x2 ) )

menghasilkan kesalahan Anda.

Dalam konteks ini, '' alias '' mengacu pada variabel yang secara linear bergantung pada variabel lain (yaitu menyebabkan multikolinieritas sempurna).

Langkah pertama menuju solusi adalah mengidentifikasi variabel mana yang menjadi biang keladinya. Menjalankan

alias( lm( y ~ x1 + x2 ) )

untuk melihat contoh.

Tamas Ferenci
sumber
Terima kasih. Apakah 'multikolinearitas' sama dengan memiliki 'koefisien alias'?
Mohit Verma
1
@MohitVerma: Dalam terminologi ini '' alias '' merujuk pada variabel yang bergantung secara linear (yaitu menyebabkan multikolinieritas sempurna). Lihat stat.ethz.ch/R-manual/R-patched/library/stats/html/alias.html . Saya memperbarui jawabannya dengan ini.
Tamas Ferenci
3

Ini sering muncul ketika Anda memiliki singularitas dalam X'Xmatriks regresi Anda (nilai-nilai NA dalam ringkasan hasil regresi).

Basis R lm()memungkinkan untuk nilai singular / multikolinieritas sempurna sebagaimana standarnya singular.ok = TRUE. Paket / fungsi lain lebih konservatif.

Misalnya, untuk linearHypothesis()fungsi dalam carpaket, standarnya adalah singular.ok = FALSE. Jika Anda memiliki multikolinieritas sempurna dalam regresi, linearHypothesis()akan menghasilkan kesalahan "ada koefisien alias dalam model". Untuk mengatasi kesalahan ini, atur singular.ok = TRUE. Namun hati-hati, karena melakukan hal ini dapat menutupi multikolinieritas sempurna dalam regresi Anda.

pedagang lilin
sumber
0

mungkin baik untuk diketahui bagi sebagian orang: Saya mendapatkan kesalahan ini juga ketika saya menambahkan boneka untuk regresi. R secara otomatis menghilangkan satu boneka, tetapi ini menyebabkan kesalahan dalam tes vif. jadi solusi, bagi sebagian orang, mungkin menghapus satu boneka secara manual.

Menepuk
sumber