Regresi logistik dengan variabel dependen biner dan independen

14

Apakah pantas untuk melakukan regresi logistik di mana kedua variabel dependen dan independen adalah biner? misalnya variabel dependen adalah 0 dan 1 dan prediktornya adalah variabel kode kontras -1 dan 1?

di atas
sumber

Jawaban:

6

Tidak ada alasan untuk tidak melakukan ini, tetapi ada dua pemikiran peringatan:

  1. Tetap berhati-hati selama analisis yang mana. Dalam proyek besar, mudah tersesat, dan menghasilkan hasil yang salah.

  2. Jika Anda memilih untuk melaporkan taksiran regresi, daripada rasio odds, jadikan skema pengkodean Anda jelas dalam laporan Anda , jadi pembaca tidak menghasilkan OR yang tidak akurat dengan asumsi mereka berdua diberi kode 0,1.

Mungkin tampak mendasar, tetapi saya telah melihat kedua masalah membuatnya menjadi makalah yang diterbitkan.

Fomite
sumber
Jadi, akan lebih baik jika memisahkan datafile menjadi 6 kasus terpisah dan menjalankan perbandingan individual dalam setiap dataset dengan prediktor kode berkode?
atas
Jujur saya tidak yakin apa yang Anda minta untuk bit kedua ini. Bisakah Anda mengklarifikasi apa yang ingin Anda capai?
Fomite
Saya memiliki dataset dengan 3 antara dan 4 dalam kondisi subjek. Saya ingin menguji untuk masing-masing dan setiap efek, tetapi satu regresi dengan semua interaksi kehilangan banyak informasi yang saya minati. Sebaliknya saya akan membagi data berdasarkan kondisi ke dalam dataset terpisah dan menjalankan regresi logistik terfokus pada setiap dataset dengan kontras kode pengkodean untuk perbedaan yang saya tertarik.
atas
untuk info lebih lanjut tentang bagaimana saya mengkode kode kontras lihat di sini: stats.stackexchange.com/questions/14546/…
upabove
11

Untuk, kejelasan: istilah "biner" biasanya disediakan hanya untuk 1 vs 0 pengkodean. Kata yang lebih umum yang cocok untuk setiap pengkodean 2-nilai adalah "dikotomis". Prediktor dikotomis tentu saja disambut baik oleh regresi logistik, seperti regresi linier, dan, karena mereka hanya memiliki 2 nilai, tidak ada bedanya apakah memasukkannya sebagai faktor atau sebagai kovariat.

ttnphns
sumber
5

Biasanya ini membantu interpretasi jika Anda mengkodekan prediksi Anda 0-1, tetapi selain dari itu (dan mencatat bahwa itu tidak diperlukan), tidak ada yang salah dengan ini. Ada beberapa pendekatan (berdasarkan tabel kontingensi) lain, tetapi jika saya ingat dengan benar, ini ternyata setara dengan (beberapa bentuk) regresi logistik.

Singkatnya: Saya tidak melihat alasan untuk tidak melakukan ini.

Nick Sabbe
sumber
Terima kasih! Dan jika saya memiliki 3 prediktor kode kontras dan saya kode semuanya 0-1 maka mereka tidak akan ortogonal. Misalnya saya memiliki 4 kategori dan tiga kode saya adalah L1: 1, -1,0,0 L2: 0,1, -1,0, L3: 0,0,1, -1. apakah itu masalah?
atas
Contoh Anda L-matrix (L1, L2, L3) adalah kontras berulang dimana setiap kategori dibandingkan dengan kategori berikut. Prediktor kontras ini tidak ortogonal atau biner (diberi kode 0-1). Bahkan, nilainya adalah .75 vs -.25 (variabel 1), .5 vs -.5 (variabel 2), .25 vs -.75 (variabel 3)
ttnphns
3

Selain itu, jika Anda memiliki lebih dari dua prediktor, maka kemungkinan besar akan ada masalah multikolinieritas bahkan untuk regresi logistik atau berganda. Namun, tidak ada salahnya menggunakan regresi logistik dengan semua variabel biner (yaitu, kode (0,1)).

statistik cinta
sumber