Interval kepercayaan untuk chi-square

10

Saya mencoba menemukan solusi untuk membandingkan dua tes "chi-square yang baik". Lebih tepatnya, saya ingin membandingkan hasil dari dua percobaan independen. Dalam percobaan ini penulis menggunakan good-of-fit chi-square untuk membandingkan tebakan acak (frekuensi yang diharapkan) dengan frekuensi yang diamati. Dua percobaan mendapat jumlah peserta yang sama dan prosedur eksperimental identik, hanya rangsangan yang berubah. Dua hasil percobaan menunjukkan chi-square yang signifikan (exp. 1: X² (18) = 45; p <.0005 dan exp. 2: X² (18) = 79; p <.0001).

Sekarang, yang ingin saya lakukan adalah menguji apakah ada perbedaan antara dua hasil ini. Saya pikir solusi bisa menggunakan interval kepercayaan tetapi saya tidak tahu bagaimana menghitung interval kepercayaan ini hanya dengan hasil ini. Atau mungkin tes untuk membandingkan ukuran efek (Cohen w)?

Adakah yang punya solusi?

Terima kasih banyak!

FD

Florian
sumber
1
Hai Florian. Mengapa tidak menggunakan tes permutasi pada perbedaan antara kuadrat chi?
Tal Galili
Hai dan terima kasih atas jawaban Anda! Hanya karena saya tidak benar-benar tahu tes permutasi. Apakah mungkin untuk melakukan permutasi hanya dengan dua nilai chi-square (saya tidak punya data mentah, hanya hasilnya)? Terima kasih lagi :)
Florian

Jawaban:

8

Informasi yang sangat terbatas yang Anda miliki tentu merupakan kendala yang parah! Namun, semuanya tidak sepenuhnya sia-sia.

Di bawah asumsi yang sama yang mengarah pada distribusi asimptotik untuk statistik uji uji good-of-fit dengan nama yang sama, statistik uji di bawah hipotesis alternatif memiliki, secara asimptotik, distribusi cent 2 noncentral . Jika kita mengasumsikan dua rangsangan adalah a) signifikan, dan b) memiliki efek yang sama, statistik uji yang terkait akan memiliki distribusi noncentral asimptotik yang sama χ 2 . Kita dapat menggunakan ini untuk membangun tes - pada dasarnya, dengan memperkirakan parameter noncentrality λ dan melihat apakah uji statistik jauh di ekor noncentral χ 2 ( 18 , λ )χ2χ2χ2λχ2(18,λ^)distribusi. (Tapi bukan berarti tes ini akan memiliki banyak kekuatan.)

Kita dapat memperkirakan parameter noncentrality mengingat dua statistik uji dengan mengambil rata-rata dan mengurangi derajat kebebasan (metode estimator momen), memberikan perkiraan 44, atau dengan kemungkinan maksimum:

x <- c(45, 79)
n <- 18

ll <- function(ncp, n, x) sum(dchisq(x, n, ncp, log=TRUE))
foo <- optimize(ll, c(30,60), n=n, x=x, maximum=TRUE)
> foo$maximum
[1] 43.67619

Kesepakatan yang baik antara dua perkiraan kami, sebenarnya tidak mengejutkan mengingat dua titik data dan kebebasan 18 derajat. Sekarang untuk menghitung nilai p:

> pchisq(x, n, foo$maximum)
[1] 0.1190264 0.8798421

Jadi nilai-p kami adalah 0,12, tidak cukup untuk menolak hipotesis nol bahwa kedua rangsangan itu sama.

λχ2(λδ,λ+δ)δ=1,2,,15δ dan lihat seberapa sering pengujian kami ditolak pada, katakanlah, tingkat kepercayaan 90% dan 95%.

nreject05 <- nreject10 <- rep(0,16)
delta <- 0:15
lambda <- foo$maximum
for (d in delta)
{
  for (i in 1:10000)
  {
    x <- rchisq(2, n, ncp=c(lambda+d,lambda-d))
    lhat <- optimize(ll, c(5,95), n=n, x=x, maximum=TRUE)$maximum
    pval <- pchisq(min(x), n, lhat)
    nreject05[d+1] <- nreject05[d+1] + (pval < 0.05)
    nreject10[d+1] <- nreject10[d+1] + (pval < 0.10)
  }
}
preject05 <- nreject05 / 10000
preject10 <- nreject10 / 10000

plot(preject05~delta, type='l', lty=1, lwd=2,
     ylim = c(0, 0.4),
     xlab = "1/2 difference between NCPs",
     ylab = "Simulated rejection rates",
     main = "")
lines(preject10~delta, type='l', lty=2, lwd=2)
legend("topleft",legend=c(expression(paste(alpha, " = 0.05")),
                          expression(paste(alpha, " = 0.10"))),
       lty=c(1,2), lwd=2)

yang memberikan yang berikut:

masukkan deskripsi gambar di sini

Melihat pada titik nol hipotesis yang sebenarnya (nilai sumbu x = 0), kita melihat bahwa tes ini konservatif, dalam hal itu tampaknya tidak menolak sesering yang ditunjukkan oleh level, tetapi tidak terlalu berlebihan. Seperti yang kami harapkan, itu tidak memiliki banyak kekuatan, tetapi lebih baik daripada tidak sama sekali. Saya ingin tahu apakah ada tes yang lebih baik di luar sana, mengingat jumlah informasi yang Anda miliki sangat terbatas.

Jbowman
sumber
Saya pemula dalam hal ini, dapatkah saya bertanya kepada Anda bagaimana menjalankan skrip (jika itu skrip) dari jawaban jbowman. Dalam kasus saya, cobalah untuk mendapatkan OR dari 90% CI. Saya sangat menghargai jika salah satu dari Anda dapat menjelaskannya kepada saya, dan saya menggunakan PASW17
Halo Ash6. Sebenarnya ini adalah skrip untuk perangkat lunak R (untuk info lebih lanjut: r-project.org ), bukan sintaks untuk PASW17. Jadi skrip ini bisa dijalankan langsung di konsol R. Script ini tidak menghitung interval kepercayaan tetapi memberi Anda nilai-p (di sini tepatnya> pchisq (x, n, foo $ maksimum ==> [1] nilai-p = 0,1190264) yang sesuai dengan uji perbedaan antara kedua eksperimen (di sini di antara dua rangsangan, dalam kasus hipotesis alternatif), dan di sini kita tidak dapat menolak hipotesis nol bahwa kedua percobaan memberikan hasil yang sama
Florian
3

Anda bisa mendapatkan Cramer's V, yang dapat ditafsirkan sebagai korelasi, mengubahnya menjadi Fisher's Z, dan kemudian interval kepercayaan yang langsung (SE = 1 / sqrt (n-3): Z ± se * 1.96). Setelah Anda mendapatkan ujung CI Anda dapat mengubahnya kembali menjadi r.

Sudahkah Anda mempertimbangkan untuk memasukkan semua hitungan Anda ke tabel kontingensi dengan dimensi percobaan lebih lanjut?

John
sumber
Saya kira itu tidak mungkin untuk menggunakan Phi dengan kebaikan Pearson fit chi-square (1 variabel). Itu sebabnya saya berbicara tentang w Cohen tetapi formula benar-benar mirip (phi = X² / n dan w = sqrt (X² / n))! Tetapi jika dimungkinkan untuk menghitung phi dengan tes ini dan menerapkan transformasi r to z, apakah Anda setuju untuk memberi kami referensi untuk mengutip? Kami ingin menggunakan tes ini dalam sebuah artikel dan beberapa pengulas bisa sangat pilih-pilih dengan statistik. Itu akan sangat membantu kami! Tentang pertanyaan Anda: kami tidak memiliki data mentah yang hanya bernilai X², df, dan p dari artikel yang diterbitkan. Terima kasih banyak atas bantuan Anda!
Florian
Maaf ... dimaksudkan untuk meletakkan Cramer's V, bukan phi. Cramer's V dapat digunakan seperti phi.
John
Dan tidak, saya tidak memiliki kutipan. Jika Anda memiliki efek besar, tidak masalah jika ada sedikit bias dalam ukuran ini. Jika Anda tidak memiliki efek besar, pastikan Anda tidak membuat tulang besar dari "signifikansi" tes apa pun.
John