Regresi dengan hanya variabel kategori

24

Apakah mungkin untuk melakukan regresi jika semua variabel dependen dan independen adalah variabel kategori?

altruis
sumber
3
Itu tentu mungkin, bahkan untuk regresi umum atau kebun, selama variabel respon (dependen) diperlakukan murni secara numerik. Tergantung pada perangkat lunak Anda, Anda mungkin perlu mendorong atau memaksakan itu terjadi. Dengan definisi regresi yang luas dan sesuai, untuk memasukkan regresi logistik atau ordinal, itu tidak hanya mungkin, itu biasa.
Nick Cox

Jawaban:

31

Kita perlu menjelaskan persyaratan kita di sini, tetapi secara umum, ya :

  • Jika variabel dependen Anda bersifat kontinu (dan residu terdistribusi normal — lihat di sini ), tetapi semua variabel independen Anda bersifat kategorikal, ini hanya ANOVA .
  • Jika variabel dependen Anda adalah kategorikal dan variabel independen Anda kontinu, ini akan menjadi regresi logistik (mungkin biner, ordinal , atau multinomial , tergantung).
  • Jika variabel dependen Anda dan variabel independen Anda adalah variabel kategorikal, Anda masih dapat menggunakan regresi logistik — ini adalah versi LOV versi ANOVA-ish.

Perhatikan bahwa regresi logistik dan regresi kuadrat terkecil (linear) adalah kasus khusus dari Generalized Linear Model .

gung - Reinstate Monica
sumber
Ini adalah kasus ketiga yang Anda sebutkan, saya mencoba LR, tidak ada koefisien yang ditemukan signifikan. Saya pikir saya mungkin melakukan sesuatu yang salah.
altruis
2
Saya tidak berpikir ANOVA memerlukan variabel dependen kontinu lebih dari itu memerlukan residu terdistribusi normal. Ini hanya kondisi di mana ANOVA diharapkan bekerja dengan baik.
Nick Cox
1
@NickCox, Anda benar, tentu saja; kami berdalih tentang bagaimana kami mendefinisikan & menerapkan persyaratan ini. Cara saya mengatakannya adalah bahwa model tersebut berasal dari asumsi-asumsi itu, tetapi ANOVA dapat digunakan bahkan jika mereka tidak terpenuhi, dengan pertanyaan apakah hasilnya akan sangat membantu tergantung.
gung - Reinstate Monica
1
@ altruist, saya meletakkan tiga kasus demi kejelasan konseptual; Saya menyadari bahwa yang terakhir adalah yang Anda inginkan. Perhatikan bahwa apakah Anda menggunakan perangkat lunak dengan benar agar sesuai dengan model & apakah koefisien Anda 'signifikan' atau tidak terkait dengan apakah LR adalah model yang sesuai untuk situasi Anda atau tidak.
gung - Reinstate Monica
4
Perhatikan bahwa menjadi kategorikal kadang-kadang masalah definisi untuk perangkat lunak, dan kadang-kadang dalam pikiran yang melihatnya. Berapa jumlah anak, misalnya?
Nick Cox