Tes-z untuk membandingkan dua proporsi adalah . Biasanya didefinisikan itu
dimana
Apakah ada referensi tertulis yang melegitimasi saya untuk menggunakan varian unpooled, yaitu
sumber
Tes-z untuk membandingkan dua proporsi adalah . Biasanya didefinisikan itu
dimana
Apakah ada referensi tertulis yang melegitimasi saya untuk menggunakan varian unpooled, yaitu
Ada sedikit diskusi tentang ini di situs AP .
Anda dapat menggunakan statistik apa pun yang Anda inginkan, asalkan Anda jelas tentang apa yang Anda lakukan dan melihat distribusi nol yang sesuai untuk menghitung nilai p atau ambang batas.
Tetapi beberapa statistik lebih baik daripada yang lain; dalam hal ini Anda akan mencari (a) distribusi nol yang mudah dihitung dan (b) kekuatan untuk mendeteksi perbedaan.
Tetapi saya tidak tahu mengapa Anda lebih menyukai varian yang tidak dikumpulkan daripada varians yang dikumpulkan untuk pengujian, meskipun itu bisa lebih disukai dalam menghitung interval kepercayaan untuk perbedaan tersebut.
Varians unpooled cenderung terlalu kecil. Ini karena di bawah hipotesis nol masih akan ada variasi peluang dalam dua proporsi yang diamati, meskipun probabilitas yang mendasarinya sama. Variasi peluang ini berkontribusi pada varians yang dikumpulkan tetapi tidak untuk varians yang tidak dikumpulkan.
Akibatnya, untuk statistik unpooled bahkan tidak kira-kira memiliki distribusi normal standar. Misalnya, ketika dan probabilitas sebenarnya keduanya , varians hanya bukan . Dengan menggunakan tabel dari distribusi normal standar, Anda akan mendapatkan nilai-p yang salah: mereka cenderung kecil secara artifisial, terlalu sering menolak nol ketika bukti tidak benar-benar ada.z n1=n2 1 / 2 z 1 / 2 1
Namun demikian, orang bertanya-tanya apakah ini dapat diperbaiki. Bisa. Pertanyaannya menjadi apakah nilai dikoreksi , berdasarkan estimasi yang tidak dikumpulkan, dapat memiliki kekuatan yang lebih besar untuk mendeteksi penyimpangan dari hipotesis nol. Beberapa simulasi cepat menunjukkan ini bukan masalahnya: tes dikumpulkan (dibandingkan dengan tes unpooled disesuaikan dengan benar) memiliki peluang lebih baik untuk menolak nol setiap kali nol adalah palsu. Karena itu saya tidak repot-repot mengerjakan rumus untuk koreksi yang tidak dikumpulkan; sepertinya tidak ada gunanya.z
Singkatnya, tes unpooled salah, tetapi dengan koreksi yang tepat, itu dapat dibuat sah. Namun, tampaknya lebih rendah dari tes yang dikumpulkan.
sumber