Koreksi kontinuitas Yates 'dalam interval kepercayaan dikembalikan oleh prop.test

8

Ini adalah interval kepercayaan yang diestimasi oleh prop.test

n <- 600; x <- 276; p <- 0.40
prop.test(x, n, p, alternative="two.sided", conf.level=0.95, correct=T)
95 percent confidence interval:
 0.4196787 0.5008409 

Saya mencoba mereproduksinya, membaca kode di bawah prop.test. Inilah cara yang disederhanakan untuk mendapatkan dua batasan itu

ESTIMATE <- x/n
YATES <- 0.5
conf.level <- 0.95
z <- qnorm((1 + conf.level)/2)
YATES <- min(YATES, abs(x - n * p)) 
z22n <- z^2/(2 * n)
p.c <- ESTIMATE + YATES/n
(p.c + z22n + z * sqrt(p.c * (1 - p.c)/n + z22n/(2 * n)))/(1 + 2 * z22n)
[1] 0.5008409
p.c <- ESTIMATE - YATES/n
(p.c + z22n - z * sqrt(p.c * (1 - p.c)/n + z22n/(2 * n)))/(1 + 2 * z22n)
[1] 0.4196787

Bisakah Anda jelaskan kepada saya mengapa probabilitas keberhasilan yang mendasari (p) digunakan pada baris 5? atau mungkin Anda bisa menyarankan di mana saya dapat menemukan lebih banyak info tentang koreksi YATES ini yang mempengaruhi ESTIMATE.

Terima kasih

George Dontas
sumber

Jawaban:

3

Halaman bantuan menunjukkan bahwa "Koreksi kontinuitas hanya digunakan jika tidak melebihi perbedaan antara proporsi sampel dan nol dalam nilai absolut." Inilah yang diperiksa baris 5: x/nadalah proporsi empiris, padalah proporsi nol. (Sebenarnya, saya menemukan "jika" sedikit menyesatkan karena ini lebih merupakan "sejauh tidak melebihi" ketika melihat baris 5.)

caracal
sumber
7

Pada pertanyaan kedua di mana Anda dapat menemukan lebih banyak info tentang koreksi kontinuitas ini (dikaitkan dengan Yates dalam bantuan untuk prop.testtetapi tidak dalam referensi di bawah ini, saya pikir sebagai Yates awalnya mengusulkan koreksi kontinuitas hanya untuk uji chi-squared untuk tabel kontingensi ) :

  1. Newcombe RG. Interval kepercayaan dua sisi untuk proporsi tunggal: perbandingan tujuh metode. Stat Med 1998; 17 (8): 857-872. PMID: 9595616

  2. Brown LD, Cai TT, DasGupta A. Estimasi interval untuk proporsi binomial (dengan Komentar & Jawaban). Ilmu Statistik 2001; 16 (2): 101-133. doi: 10.1214 / ss / 1009213286

Interval skor Wilson yang dikoreksi kontinuitas adalah 'metode 4' dalam Newcomb. Brown et al. pertimbangkan hanya interval skor Wilson yang tidak dikoreksi dalam teks utama, tetapi George Casella menyarankan menggunakan versi kontinuitas yang diperbaiki dalam Komentarnya (hal. 121), yang Brown et al. bahas dalam Rejoinder mereka (hal. 130):

Casella menyarankan kemungkinan melakukan koreksi kontinuitas pada statistik skor sebelum membangun interval kepercayaan. Kami tidak setuju dengan proposal ini dari sudut pandang apa pun. Interval “kontinuitas yang dikoreksi Wilson” ini memiliki sifat cakupan yang sangat konservatif, meskipun pada prinsipnya tidak dijamin di mana pun konservatif. Tetapi bahkan jika tujuan seseorang, tidak seperti tujuan kita, adalah untuk menghasilkan interval konservatif, interval ini akan sangat tidak efisien pada tingkat normal mereka dibandingkan dengan Blyth-Still atau bahkan Clopper-Pearson.

Interval 'tepat' Clopper-Pearson disediakan oleh binom.testdalam R. Saya sarankan menggunakan itu daripada prop.testjika Anda ingin interval konservatif, yaitu yang menjamin setidaknya 95% cakupan. Jika Anda lebih suka interval yang rata-rata mendekati 95% cakupan (lebih dari p) dan karena itu akan sering lebih sempit, Anda bisa menggunakan prop.test(…, correct=FALSE)untuk memberikan interval skor Wilson yang tidak dikoreksi.

Buku teks standar untuk hal-hal tersebut adalah Metode Statistik Fleiss untuk Tarif dan Proporsi . Newcomb mereferensikan edisi asli 1981 tetapi edisi terbaru adalah edisi ke-3 (2003) . Saya belum memeriksanya sendiri.

onestop
sumber
2
Referensi lain untuk perbandingan CI binomial adalah Brown LD, Cai TT, & DasGupta, A. (2001). Estimasi Interval untuk Proporsi Binomial. Ilmu Statistik, 16 (2), 101-133. projecteuclid.org/euclid.ss/1009213286 (akses terbuka). binomPaket R juga memiliki Agresti-Coull CI.
caracal