Apakah pantas untuk melakukan regresi logistik di mana kedua variabel dependen dan independen adalah biner? misalnya variabel dependen adalah 0 dan 1 dan prediktornya adalah variabel kode kontras -1 dan 1?
14
Tidak ada alasan untuk tidak melakukan ini, tetapi ada dua pemikiran peringatan:
Tetap berhati-hati selama analisis yang mana. Dalam proyek besar, mudah tersesat, dan menghasilkan hasil yang salah.
Jika Anda memilih untuk melaporkan taksiran regresi, daripada rasio odds, jadikan skema pengkodean Anda jelas dalam laporan Anda , jadi pembaca tidak menghasilkan OR yang tidak akurat dengan asumsi mereka berdua diberi kode 0,1.
Mungkin tampak mendasar, tetapi saya telah melihat kedua masalah membuatnya menjadi makalah yang diterbitkan.
Untuk, kejelasan: istilah "biner" biasanya disediakan hanya untuk 1 vs 0 pengkodean. Kata yang lebih umum yang cocok untuk setiap pengkodean 2-nilai adalah "dikotomis". Prediktor dikotomis tentu saja disambut baik oleh regresi logistik, seperti regresi linier, dan, karena mereka hanya memiliki 2 nilai, tidak ada bedanya apakah memasukkannya sebagai faktor atau sebagai kovariat.
sumber
Biasanya ini membantu interpretasi jika Anda mengkodekan prediksi Anda 0-1, tetapi selain dari itu (dan mencatat bahwa itu tidak diperlukan), tidak ada yang salah dengan ini. Ada beberapa pendekatan (berdasarkan tabel kontingensi) lain, tetapi jika saya ingat dengan benar, ini ternyata setara dengan (beberapa bentuk) regresi logistik.
Singkatnya: Saya tidak melihat alasan untuk tidak melakukan ini.
sumber
Selain itu, jika Anda memiliki lebih dari dua prediktor, maka kemungkinan besar akan ada masalah multikolinieritas bahkan untuk regresi logistik atau berganda. Namun, tidak ada salahnya menggunakan regresi logistik dengan semua variabel biner (yaitu, kode (0,1)).
sumber