Regresi Logistik - Masalah / Jebakan Multikolinearitas

16

Dalam Regresi Logistik, adakah kebutuhan untuk mempedulikan multikolinieritas seperti halnya Anda akan menggunakan regresi OLS langsung?

Misalnya, dengan regresi logistik, di mana terdapat multikolinieritas, apakah Anda harus berhati-hati (seperti halnya dalam regresi OLS) dengan mengambil kesimpulan dari koefisien Beta?

Untuk regresi OLS satu "memperbaiki" ke multikolinieritas tinggi adalah regresi ridge, adakah yang seperti itu untuk regresi logistik? Juga, menjatuhkan variabel, atau menggabungkan variabel.

Pendekatan apa yang masuk akal untuk mengurangi efek multikolinieritas dalam regresi logistik? Apakah mereka pada dasarnya sama dengan OLS?

(Catatan: ini bukan untuk tujuan percobaan yang dirancang)

Brandon Bertelsen
sumber

Jawaban:

16

Semua prinsip yang sama tentang multikolinieritas berlaku untuk regresi logistik seperti halnya pada OLS. Diagnostik yang sama menilai multikolinieritas dapat digunakan (misalnya VIF, nomor kondisi, regresi bantu.), Dan teknik reduksi dimensi yang sama dapat digunakan (seperti menggabungkan variabel melalui analisis komponen utama).

Jawaban ini oleh chl akan membawa Anda ke beberapa sumber daya dan paket R untuk menyesuaikan model logistik yang dihukum (serta diskusi yang baik tentang jenis prosedur regresi yang dihukum ini). Tetapi beberapa komentar Anda tentang "solusi" untuk multikolinieritas sedikit membingungkan saya. Jika Anda hanya peduli memperkirakan hubungan untuk variabel yang tidak collinear, "solusi" ini mungkin baik-baik saja, tetapi jika Anda tertarik untuk memperkirakan koefisien variabel yang collinear, teknik ini tidak menyelesaikan masalah Anda. Meskipun masalah multikolinearitas bersifat teknis karena matriks variabel prediktor Anda tidak dapat dibalik, ia memiliki analog logis karena prediktor Anda tidak independen, dan efeknya tidak dapat diidentifikasi secara unik.

Andy W
sumber
2
(+1) Ya, ada beberapa versi regresi logistik yang dihukum (atau lebih umum, GLM), lihat beberapa referensi di sana: stats.stackexchange.com/questions/4272/… .
chl
@ chl, terima kasih. Saya telah memperbarui untuk menautkan ke jawaban Anda sebelumnya.
Andy W
Terima kasih juga. Ini hanya komentar pada respons Anda yang sudah sangat baik.
chl