Katakanlah saya ingin tahu ukuran sampel apa yang saya butuhkan untuk percobaan di mana saya ingin menentukan apakah perbedaan dalam dua proporsi keberhasilan itu signifikan secara statistik. Inilah proses saya saat ini:
- Lihatlah data historis untuk menetapkan prediksi baseline. Katakan bahwa di masa lalu, mengambil tindakan menghasilkan tingkat keberhasilan 10% sedangkan tidak mengambil tindakan menghasilkan tingkat kesuksesan 9%. Asumsikan bahwa kesimpulan ini belum divalidasi secara statistik tetapi kesimpulannya didasarkan pada jumlah data yang relatif besar (10.000+ pengamatan).
Tancapkan asumsi ini ke dalam power.prop.test untuk mendapatkan yang berikut:
power.prop.test(p1=.1,p2=.11,power=.9) Two-sample comparison of proportions power calculation n = 19746.62 p1 = 0.1 p2 = 0.11 sig.level = 0.05 power = 0.9 alternative = two.sided
Jadi ini memberitahu saya bahwa saya akan membutuhkan ukuran sampel ~ 20000 dalam setiap kelompok tes A / B untuk mendeteksi perbedaan yang signifikan antara proporsi.
Langkah selanjutnya adalah melakukan percobaan dengan 20.000 pengamatan di setiap kelompok. Grup B (tidak ada tindakan yang diambil) memiliki 2.300 keberhasilan dari 20.000 pengamatan, sedangkan Grup A (tindakan diambil) memiliki 2.200 keberhasilan dari 20.000 pengamatan.
Lakukan prop.test
prop.test(c(2300,2100),c(20000,20000)) 2-sample test for equality of proportions with continuity correction data: c(2300, 2100) out of c(20000, 20000) X-squared = 10.1126, df = 1, p-value = 0.001473 alternative hypothesis: two.sided 95 percent confidence interval: 0.003818257 0.016181743 sample estimates: prop 1 prop 2 0.115 0.105
Jadi kita katakan bahwa kita dapat menolak hipotesis nol bahwa proporsinya sama.
Pertanyaan
- Apakah metode ini masuk akal atau paling tidak di jalur yang benar?
- Bisakah saya menentukan
alt="greater"
prop.test dan mempercayai nilai-p meskipun power.prop.test adalah untuk pengujian dua sisi? - Bagaimana jika nilai p lebih besar dari 0,05 pada prop.test? Haruskah saya berasumsi bahwa saya memiliki sampel yang signifikan secara statistik tetapi tidak ada perbedaan yang signifikan secara statistik antara kedua proporsi? Selain itu, apakah signifikansi statistik melekat dalam nilai-p dalam prop.test - yaitu apakah power.prop.test bahkan diperlukan?
- Bagaimana jika saya tidak bisa melakukan split 50/50 dan perlu melakukan, katakanlah, split 95/5? Apakah ada metode untuk menghitung ukuran sampel untuk kasus ini?
- Bagaimana jika saya tidak tahu apa yang seharusnya menjadi prediksi dasar saya untuk proporsi? Jika saya menebak dan proporsi sebenarnya jauh, apakah itu akan membatalkan analisis saya?
Setiap celah lain yang bisa Anda isi akan sangat dihargai - permintaan maaf saya atas sifat rumit dari pos ini. Terima kasih!
>
pada awal blok yang dikutip) daripada hanya membesar-besarkannya.