Jawaban untuk pertanyaan 1 akan tergantung pada pertanyaan penelitian Anda, dan siapa audiens untuk hasilnya.
Jika pertanyaan penelitian Anda menunjuk pada berbicara tentang perbedaan dalam b berdasarkan profil A, maka itu jelas akan membantu membingkai ringkasan Anda. Dalam sebuah studi epidemiologi, bahkan jika Anda tidak mengambil sampel berdasarkan A (variabel independen sebagai status terbuka / tidak terpajan) masih masuk akal untuk menggunakan klasifikasi ini sebagai variabel independen [paparan] dan variabel kontinu sebagai variabel dependen [hasil ] Sepertinya Anda sudah tahu jawabannya.
Anda juga harus mempertimbangkan bagaimana Anda dapat menafsirkan hasil dalam hal menyajikan hasil kepada orang lain (dan menafsirkannya sendiri). Model [hasil] variabel kontinyu sebagai variabel dependen akan memiliki perbedaan rata-rata (atau serupa) sebagai satu ringkasan; model dikotomus-variabel-sebagai-hasil akan memiliki rasio peluang (rasio peningkatan peluang per satu unit variabel kontinu, yang dapat diskalakan untuk memberikan misalnya peningkatan relatif per lima kilogram berat tambahan untuk kemungkinan diabetes tipe II.)
Pengalaman saya dari pengaturan konsultasi dan menjelaskan hal ini kepada orang-orang adalah bahwa yang pertama (perbedaan dalam rata-rata) umumnya lebih mudah dijelaskan kepada orang lain daripada yang terakhir (rasio odds per satu unit perbedaan dari variabel independen kontinu.)
Untuk pertanyaan Anda 2 , jika Anda ingin menjalankan model multivariabel, di mana Anda mengendalikan kovariat, maka akan membantu untuk memilih variabel dependen / independen di awal. Mungkin lebih baik untuk tetap dengan metode yang sama dari analisis univariat ke multivariabel, daripada mengubah antara dua pendekatan, hanya dari kemudahan penjelasan.
Catatan akhir pada poin terakhir ini: dari perspektif pengujian hipotesis, regresi logistik dengan variabel independen kontinu [eksposur] dan variabel dependen dikotomis tunggal harus mengembalikan nilai-p yang sama dengan uji-t tidak berpasangan dengan asumsi perbedaan tidak sama dengan variabel. terbalik (dari memori - saya tidak sepenuhnya yakin apakah ini selalu benar.)
Tes Wilcoxon-Mann-Whitney adalah kasus khusus dari model logistik ordinal odds proporsional sehingga Anda bisa mengatakan tidak perlu mengubah model untuk menggunakan regresi logistik. Tetapi masalah mendasar dalam memilih model adalah menentukan variabel mana yang masuk akal untuk disesuaikan.
sumber
Itu merupakan upaya jawaban parsial:
Saya akan menggunakan tes Mann Whitney karena lebih sedikit membuat asumsi. Regresi logistik mengasumsikan bentuk dekat (yaitu logit) untuk hubungan antara dua variabel ini). Selain itu, regresi logistik mengasumsikan bahwa adalah Bernoulli diberikan : jika ini bukan kasusnya (misalnya, jumlah sampel apriori dengan dan seperti dalam studi kasus-kontrol) dipilih, saya tidak yakin apakah hasilnya (seperti nilai-p) akan tetap bertahan. Namun, saya sudah melihat banyak orang melakukan ini.Y X Y=1 Y=0
Di sisi lain, Mann Whitney tampaknya tidak memiliki masalah dengan ini, yaitu, ia memegang atau tidak itu adalah studi kasus-kontrol.
sumber
Seperti halnya banyak pertanyaan, jawabannya tergantung pada tujuan mendasar Anda dalam melakukan analisis. Jika Anda tertarik untuk tidak hanya menunjukkan bahwa ada hubungan yang signifikan antara variabel dikotomis A dan variabel kontinu b, tetapi juga mampu menghitung kemungkinan yang diharapkan dari peristiwa yang dicatat dalam variabel A, maka Anda ingin menggunakan logistik regresi, karena pendekatan ini memberi Anda persamaan regresi. Selain itu, regresi logistik dalam kasus bivariat A dan b dapat diperluas ke kasus multivariat dalam memprediksi A dari b dan banyak variabel independen lainnya untuk tujuan mengendalikan kovariat, menguji model mediasional, memeriksa interaksi, dan semua hal baik lain yang bisa kita lakukan dengan regresi berganda. Setelah mengatakan itu, Anda mungkin harus mempertimbangkan fungsi tautan yang menghubungkan variabel dikotomis A dengan variabel kontinu B. Regresi logistik menggunakan tautan logit, yang lebih tepat ketika probabilitas hasilnya sangat tinggi atau rendah, sementara tautan probit mungkin lebih tepat ketika kemungkinan acara lebih dekat dengan .5 Memilih fungsi tautan yang sesuai untuk data Anda adalah penting untuk membangun model regresi yang baik. Beberapa informasi lebih lanjut tentang fungsi tautan dapat ditemukan di tautan berikut: 5 Memilih fungsi tautan yang sesuai untuk data Anda adalah penting untuk membangun model regresi yang baik. Beberapa informasi lebih lanjut tentang fungsi tautan dapat ditemukan di tautan berikut: 5 Memilih fungsi tautan yang sesuai untuk data Anda adalah penting untuk membangun model regresi yang baik. Beberapa informasi lebih lanjut tentang fungsi tautan dapat ditemukan di tautan berikut:
http://www.stat.ufl.edu/CourseINFO/STA6167/logistregSFLM.pdf
http://www.norusis.com/pdf/ASPC_v13.pdf
sumber
cloglog
ketika kategori respons tidak seimbang, tetapi ada opsi lain.