Saya tertarik pada pemodelan data respons biner dalam observasi berpasangan. Kami bertujuan untuk membuat kesimpulan tentang efektivitas intervensi pra-pasca dalam suatu kelompok, berpotensi menyesuaikan diri untuk beberapa kovariat dan menentukan apakah ada modifikasi efek oleh kelompok yang menerima pelatihan yang sangat berbeda sebagai bagian dari intervensi.
Diberikan data dari formulir berikut:
id phase resp
1 pre 1
1 post 0
2 pre 0
2 post 0
3 pre 1
3 post 0
Dan tabel kontingensi informasi tanggapan berpasangan:
Kami tertarik pada pengujian hipotesis: .
Uji McNemar memberikan: bawah (asimptotik). Ini intuitif karena, di bawah nol, kami berharap proporsi yang sama dari pasangan sumbang ( dan ) lebih menyukai efek positif ( ) atau efek negatif ( ). Dengan probabilitas definisi case positif didefinisikan dan . Peluang untuk mengamati pasangan sumbang positif adalah . H0bcbcp=b n=b+cp
Di sisi lain, regresi logistik bersyarat menggunakan pendekatan yang berbeda untuk menguji hipotesis yang sama, dengan memaksimalkan kemungkinan bersyarat:
di mana .
Jadi, apa hubungan antara tes-tes ini? Bagaimana seseorang dapat melakukan tes sederhana dari tabel kontingensi yang disajikan sebelumnya? Melihat kalibrasi nilai-p dari pendekatan clogit dan McNemar di bawah nol, Anda akan berpikir mereka sama sekali tidak berhubungan!
library(survival)
n <- 100
do.one <- function(n) {
id <- rep(1:n, each=2)
ph <- rep(0:1, times=n)
rs <- rbinom(n*2, 1, 0.5)
c(
'pclogit' = coef(summary(clogit(rs ~ ph + strata(id))))[5],
'pmctest' = mcnemar.test(table(ph,rs))$p.value
)
}
out <- replicate(1000, do.one(n))
plot(t(out), main='Calibration plot of pvalues for McNemar and Clogit tests',
xlab='p-value McNemar', ylab='p-value conditional logistic regression')
sumber
exact2x2
dapat menjadi referensi.Jawaban:
Maaf, ini masalah lama, saya menemukan ini secara kebetulan.
Ada kesalahan dalam kode Anda untuk tes mcnemar. Coba dengan:
sumber
Ada 2 model statistik yang bersaing. Model # 1 (hipotesis nol, McNemar): probabilitas benar ke salah = probabilitas salah ke benar = 0,5 atau setara b = c. Model # 2: probabilitas benar ke salah <probabilitas salah ke benar atau setara b> c. Untuk model # 2 kami menggunakan metode kemungkinan maksimum dan regresi logistik untuk menentukan parameter model yang mewakili model 2. Metode statistik terlihat berbeda karena masing-masing metode mencerminkan model yang berbeda.
sumber