Karena kedua metrik Anda adalah 1) biner dan 2) berekor berat, Anda harus menghindari uji-t yang mengasumsikan distribusi normal.
Saya pikir Mann-Whitney U adalah pilihan terbaik Anda dan harus cukup efisien bahkan jika distribusi Anda mendekati normal.
Mengenai pertanyaan kedua Anda:
Apa yang terjadi jika satu tes menunjukkan perbedaan yang signifikan antara kohort dan beberapa tes lain menunjukkan perbedaan yang tidak signifikan?
Ini tidak jarang jika perbedaan statistik adalah garis batas dan data memiliki distribusi sampel "berantakan". Situasi ini mengharuskan analis untuk mempertimbangkan dengan hati - hati semua asumsi dan batasan dari setiap uji statistik, dan memberikan bobot terbesar pada uji statistik yang memiliki jumlah pelanggaran asumsi terendah.
Ambil asumsi distribusi Normal. Ada berbagai tes untuk normalitas, tetapi itu bukan akhir dari cerita. Beberapa tes bekerja dengan baik pada distribusi simetris bahkan jika ada beberapa penyimpangan dari normalitas, tetapi tidak bekerja dengan baik pada distribusi miring.
Sebagai aturan umum, saya sarankan Anda tidak menjalankan tes apa pun di mana salah satu asumsinya jelas-jelas dilanggar.
EDIT: Untuk variabel kedua, mungkin layak untuk mengubah variabel menjadi variabel yang terdistribusi normal (atau paling tidak dekat) selama transformasi tersebut mempertahankan pesanan. Anda harus memiliki keyakinan yang baik bahwa transformasi menghasilkan distribusi normal untuk kedua kohort. Jika Anda memasukkan variabel kedua ke distribusi log-normal, maka fungsi log mengubahnya menjadi distribusi normal. Tetapi jika distribusinya adalah Pareto (hukum kekuasaan), maka tidak ada transformasi ke distribusi normal.
EDIT: Seperti yang disarankan dalam komentar ini , Anda harus mempertimbangkan Bayesian Estimation sebagai alternatif untuk uji-t dan Pengujian Nign Hypothesis Significance (NHST) lainnya.
Untuk data bernilai nyata, Anda mungkin juga ingin mempertimbangkan membuat statistik pengujian Anda sendiri berdasarkan bootstrap data Anda. Pendekatan ini cenderung menghasilkan hasil yang akurat ketika Anda berurusan dengan distribusi populasi yang tidak normal, atau mencoba mengembangkan interval kepercayaan di sekitar parameter yang tidak memiliki solusi analitik yang nyaman. (Yang pertama benar dalam kasus Anda. Saya hanya menyebutkan yang terakhir untuk konteks.)
Untuk data nyata Anda, Anda akan melakukan hal berikut:
Setelah Anda mendapatkan distribusi itu, hitung selisih rata-rata untuk sampel Anda yang sebenarnya, dan hitung nilai-p.
sumber
Saya kedua @ jawaban MrMeritology. Sebenarnya saya bertanya-tanya apakah tes MWU akan kurang kuat daripada tes proporsi independen, karena buku teks yang saya pelajari dan digunakan untuk mengajar mengatakan bahwa MWU dapat diterapkan hanya untuk data ordinal (atau interval / rasio).
Tetapi hasil simulasi saya, diplot di bawah ini, menunjukkan bahwa tes MWU sebenarnya sedikit lebih kuat daripada tes proporsi, sementara mengendalikan tipe I kesalahan dengan baik (pada proporsi populasi kelompok 1 = 0,50).
Proporsi populasi kelompok 2 dijaga pada 0,50. Jumlah iterasi adalah 10.000 di setiap titik. Saya mengulangi simulasi tanpa koreksi Yate tetapi hasilnya sama.
sumber