Regresi logistik vs chi-square dalam tabel kontingensi 2x2 dan Ix2 (faktor tunggal - respons biner)?

10

Saya mencoba memahami penggunaan regresi logistik dalam tabel kontingensi 2x2 dan Ix2. Misalnya, menggunakan ini sebagai contoh

masukkan deskripsi gambar di sini

Apa perbedaan antara menggunakan uji chi-square dan menggunakan regresi logistik? Bagaimana dengan tabel dengan beberapa faktor nominal (tabel Ix2) seperti ini:

masukkan deskripsi gambar di sini

Ada pertanyaan serupa di sini - tetapi jawabannya terutama bahwa chi-square dapat menangani tabel mxn, tetapi pertanyaan saya adalah apa yang spesifik untuk ketika ada hasil biner dan faktor nominal tunggal. (Tautan tertaut juga merujuk ke utas ini , tetapi ini berkenaan dengan variabel / faktor mutiple).

Jika hanya faktor tunggal (yaitu tidak perlu mengontrol variabel lain) dengan respons biner, apa perbedaan tujuan melakukan regresi logistik?

L Xandor
sumber
Memberi +1 untuk pertanyaan, tetapi Anda harus memfasilitasi penyalinan dan menempelkan data untuk mengatasinya.
Antoni Parellada
2
Lihat Mengapa nilai-p saya berbeda antara output regresi logistik, uji chi-squared, dan interval kepercayaan untuk OR? . Uji chi-squared Pearson untuk asosiasi hanyalah tes skor untuk hipotesis nol bahwa semua lereng adalah nol. Uji rasio kemungkinan yang sesuai setara asimptotik. Seperti yang dikatakan oleh @Kodiologist, kegunaan regresi logistik lebih luas daripada menguji bahwa semua lereng adalah nol.
Scortchi

Jawaban:

12

Pada akhirnya, itu adalah apel dan jeruk.

Regresi logistik adalah cara untuk memodelkan variabel nominal sebagai hasil probabilistik dari satu atau lebih variabel lainnya. Menyesuaikan model logistik-regresi mungkin ditindaklanjuti dengan pengujian apakah koefisien model berbeda secara signifikan dari 0, menghitung interval kepercayaan untuk koefisien, atau memeriksa seberapa baik model dapat memprediksi pengamatan baru.

The uji χ² kemerdekaan adalah uji signifikansi tertentu yang menguji hipotesis nol bahwa dua variabel nominal independen.

Apakah Anda harus menggunakan regresi logistik atau tes χ² tergantung pada pertanyaan yang ingin Anda jawab. Misalnya, tes χ² dapat memeriksa apakah tidak masuk akal untuk percaya bahwa partai politik terdaftar seseorang tidak tergantung pada ras mereka, sedangkan regresi logistik dapat menghitung probabilitas bahwa seseorang dengan ras, usia, dan jenis kelamin tertentu adalah milik masing-masing partai politik .

Kodiologis
sumber
Terima kasih. Apakah Anda dapat memberi saya contoh dari berbagai jenis pertanyaan yang dapat Anda jawab dengan metode yang berbeda? Adakah sumber daya khusus yang dapat Anda rekomendasikan untuk memahami berbagai pertanyaan yang dapat dijawab dengan dua metode ini?
L Xandor
Saya menambahkan contoh untuk jawaban saya. Mengenai pertanyaan kedua Anda, Wikipedia adalah tempat yang layak untuk memulai. Juga, sebagian besar buku teks statistik terapan pengantar akan menyebutkan uji independensi dan regresi logistik.
Kodiologist
Terima kasih. Saya masih tidak jelas apa bedanya dalam kasus spesifik tabel kontingensi 2x2? chi square akan memeriksa apakah hasilnya tidak tergantung pada variasi faktor, tetapi apa yang dilakukan regresi logistik di sini? Saya mengerti LR berguna untuk melakukan prediksi berdasarkan serangkaian faktor, tetapi ketika datang ke 2x2 sederhana saya tidak yakin apa bedanya (tapi itu jelas digunakan) ... bisakah Anda (atau siapa saja) menggunakan 2x2 tabel stress / reflux pada postingan asli sebagai contoh nyata bagaimana mereka akan digunakan secara berbeda? Ini adalah kasus faktor tunggal yang paling saya minati
L Xandor
atau ras / partai politik bekerja dengan baik sebagai contoh, tetapi ketika Anda kemudian menggunakan regresi logistik Anda menggunakan banyak faktor, dan saya dapat melihat bagaimana hal itu berguna di sana ... tetapi apa yang saya secara khusus memiliki kesulitan memahami mengapa gunakan LR (atau bagaimana perbedaannya) dalam case factor tunggal. Jika kedua metode digunakan untuk menguji hubungan antara ras dan partai politik, apa perbedaan antara chi square dan regresi logistik?
L Xandor
Dalam kasus contoh stres dan refluks, Anda bisa menggunakan regresi logistik untuk menguji apakah stres secara signifikan mempengaruhi probabilitas refluks, atau Anda bisa menghitung interval kepercayaan untuk rasio odds yang menyatakan efek ini. Salah satu cara di mana ini secara konseptual berbeda dari tes χ² adalah bahwa salah satu stres atau refluks ditafsirkan sebagai variabel dependen. Namun dalam hal apa pun, regresi logistik dapat dianggap berlebihan untuk tabel kontingensi 2-oleh-2.
Kodiologist