Bagaimana cara menangani pertanyaan survei dengan beberapa respons?

10

Saya memiliki dataset yang menanyakan kepada orang-orang apakah mereka pernah ke tempat tertentu (misalnya A, B, C, D), dan mereka dapat membuat lebih dari satu pilihan, kemudian spesimen diambil dari hidung mereka untuk melihat apakah mereka terinfeksi dengan beberapa penyakit.

Saya perlu mengetahui risiko relatif terinfeksi untuk orang yang pergi ke tempat tertentu, saya hanya bisa memikirkan regresi logistik sekarang, apakah ada saran lain?

Terima kasih.

lokheart
sumber

Jawaban:

2

Anda masih dapat menggunakan regresi logistik karena hasil Anda dikotomis, terinfeksi vs tidak terinfeksi. Saya hanya akan mengambil pendekatan variabel dummy dan tidak menggunakan perjalanan sebagai kategori referensi (yaitu untuk setiap tempat Anda memiliki variabel kode 1 jika mereka mengunjungi tempat itu dan diberi kode 0 jika mereka tidak mengunjungi tempat itu). Dengan demikian, jika Anda mengubah koefisien beta menjadi peluang (yaitu, eksponensial peluang log) interpretasi variabel dummy untuk lokasi A akan menjadi rasio odds dari lokasi kunjungan A daripada tidak mengunjungi lokasi A yang mengontrol tempat lain yang dikunjungi. Perhatikan juga dalam pendekatan ini, multi-collinearity menjadi perhatian (mis. Jika banyak orang yang bepergian ke A juga bepergian ke B, mungkin bias masing-masing koefisien mereka).

Andy W
sumber
5
Model ini mengasumsikan respon adalah fungsi tambahan dari perjalanan ke setiap tempat, yang sangat tidak mungkin. Itu masih dapat dibuat untuk bekerja dengan memasukkan istilah interaksi. Satu set lengkap dari semua interaksi yang mungkin mungkin diperlukan (di luar hanya interaksi dua arah). (Itu akan secara matematis identik dengan menyediakan boneka terpisah untuk setiap kemungkinan kombinasi tujuan.)
whuber
4
Lebih baik memiliki banyak data jika Anda menggunakan semua interaksi (15 parameter) daripada hanya efek utama (4 parameter) ...
Stephan Kolassa
@whuber dan @Stephen, Terima kasih atas tanggapannya, dan saya setuju sepenuhnya dengan Anda masing-masing. Saya pribadi akan baik-baik saja dengan pendekatan variabel dummy efek utama jika beberapa tanggapan tidak terlalu umum, yang mungkin bukan asumsi yang dapat dipertahankan mengingat kekhawatiran poster asli. Saya mungkin akan mengusulkan desain lain jika poster aslinya tertarik pada risiko bepergian ke A vs B (seperti beberapa jenis prosedur pencocokan). Dan saya setuju risiko aditif tidak masuk akal kecuali jika beberapa bias seleksi terjadi.
Andy W