Analisis daya untuk data binomial ketika hipotesis nol adalah

Saya ingin melakukan analisis kekuatan untuk sampel tunggal dari data binomial, dengan $H_0: p = 0$ , vs $H_1: p = 0.001$ , di mana $p$ adalah proporsi keberhasilan dalam populasi. Jika $0 < p <1$ , saya bisa menggunakan aproksimasi normal ke binomial, atau $\chi^2$ -tes, tetapi dengan $p =0$ , keduanya gagal. Saya ingin tahu apakah ada cara untuk melakukan analisis ini. Saya sangat menghargai saran, komentar, atau referensi. Terimakasih banyak!

hypothesis-testing sample-size power-analysis power pengguna765195
sumber

Jadi mengapa Anda tidak menggunakan tes Clopper-Pearson yang tepat?

Stéphane Laurent

Saya harap Anda memiliki sampel yang sangat besar! Ini akan sulit untuk diuji.

Peter Flom - Reinstate Monica

Jawaban:

Anda memiliki hipotesis alternatif satu sisi yang tepat $p_{1} > p_{0}$ mana $p_{1} = 0.001$ dan $p_{0} = 0$ .

$c$ $c$ $n$ $\alpha = 0.05$ $c=1$ $n \geqslant 1$ $\alpha > 0$
Langkah kedua adalah untuk mengetahui probabilitas untuk mendapatkan setidaknya keberhasilan dalam sampel ukuran bawah hipotesis alternatif - ini adalah kekuatan Anda. Di sini, Anda perlu tetap sehingga distribusi Binomial sepenuhnya ditentukan. $c$ $n$ $n$ $\mathcal{B}(n, p_{1})$

Langkah kedua dalam R dengan : $n = 500$

> n  <- 500                 # sample size
> p1 <- 0.001               # success probability under alternative hypothesis
> cc <- 1                   # threshold
> sum(dbinom(cc:n, n, p1))  # power: probability for cc or more successes given p1
[1] 0.3936211

Untuk mendapatkan gambaran bagaimana daya berubah dengan ukuran sampel, Anda dapat menggambar fungsi daya: masukkan deskripsi gambar di sini

nn   <- 10:2000                 # sample sizes
pow  <- 1-pbinom(cc-1, nn, p1)  # corresponding power
tStr <- expression(paste("Power for ", X>0, " given ", p[1]==0.001))
plot(nn, pow, type="l", xaxs="i", xlab="sample size", ylab="power",
     lwd=2, col="blue", main=tStr, cex.lab=1.4, cex.main=1.4)

Jika Anda ingin tahu ukuran sampel apa yang Anda butuhkan untuk mencapai setidaknya daya yang ditentukan sebelumnya, Anda dapat menggunakan nilai daya yang dihitung di atas. Katakanlah Anda menginginkan kekuatan minimal . $0.5$

> powMin <- 0.5
> idx    <- which.min(abs(pow-powMin))  # index for value closest to 0.5
> nn[idx]     # sample size for that index
[1] 693

> pow[idx]    # power for that sample size
[1] 0.5000998

Jadi, Anda perlu ukuran sampel setidaknya untuk mencapai kekuatan . $693$ $0.5$

caracal
sumber

Menurut pwr.p.test, untuk kekuatan 0,5, Anda memerlukan setidaknya 677 pengamatan. Tetapi daya = 0,5 sangat rendah!

Jessica

@caracal Apakah Anda menggunakan perkiraan normal untuk mendapatkan kurva daya Anda? Fungsi daya binomial yang tepat tidak akan begitu mulus. Ini sebenarnya gigi gergaji yang bisa Anda lihat jika sumbu ukuran sampel diperbesar. Saya membahas hal ini dalam makalah 2002 saya di American Statistician yang bekerja sama dengan Christine Liu. Binomial juga sangat miring pada p sangat rendah sehingga n harus besar agar perkiraan normal berfungsi dengan baik.

Michael R. Chernick

@MichaelChernick Tidak, ini dari distribusi binomial, bukan dari perkiraan normal. Tentu saja Anda benar bahwa - secara umum - kekuatan untuk tes binomial adalah fungsi gigi gergaji yang tidak monoton. Tetapi perhatikan bahwa kami memiliki kasus khusus di sini dengan . Ini berarti bahwa wilayah penerimaan untuk hipotesis alternatif selalu dimulai pada 1, terlepas dari . Dengan ambang konstan , konstanta , daya adalah fungsi peningkatan ketat .

p_{0} = 0

$p_{0} = 0$

n

$n$

c = 1

$c = 1$

p_{1} = 0.001

$p_{1} = 0.001$

n

$n$

caracal

@Jessica Note yang pwr.p.test()menggunakan perkiraan normal, bukan distribusi binomial yang tepat. Cukup ketik pwr.p.testuntuk melihat kode sumber. Anda akan menemukan panggilan untuk pnorm()menunjukkan bahwa perkiraan digunakan.

caracal

@caracal Jadi saya bisa melihatnya dengan cara ini: Di bawah hipotesis nol probabilitas keberhasilan adalah 0 maka jika Anda pernah melihat kesuksesan, Anda dapat menolak hipotesis nol. Itulah mengapa Anda mengatakan ambangnya adalah 1 karena jika jumlah binomial mencapai 1, Anda dapat menolak dengan kesalahan tipe 2 0! Sekarang di bawah alternatif probabilitas keberhasilan pertama pada percobaan ke-n adalah (1-p) p. Probabilitas ini menjadi 0 saat n menuju tak terhingga. Jadi aturan berurutan akan berhenti ketika S = 1 akan memiliki daya 1 untuk p> 0.

^{n}

$^n$

^{-}

$^-$

^{1}

$^1$

_{n}

$_n$

Michael R. Chernick

Anda dapat menjawab pertanyaan ini dengan mudah dengan pwrpaket di R.

Anda perlu menentukan tingkat signifikansi, kekuatan, dan ukuran efek. Biasanya, tingkat signifikansi diatur ke 0,05 dan daya ditetapkan ke 0,8. Kekuatan yang lebih tinggi akan membutuhkan lebih banyak pengamatan. Level signifikansi yang lebih rendah akan menurunkan daya.

Ukuran efek untuk proporsi yang digunakan dalam paket ini adalah Cohen h. Batas untuk jam kecil sering dianggap 0,20. Batas aktual bervariasi menurut aplikasi, dan mungkin lebih kecil dalam kasus Anda. Semakin kecil h berarti diperlukan lebih banyak pengamatan. Anda mengatakan alternatif Anda adalah . Itu sangat kecil $p = 0.001$

> ES.h(.001, 0)
[1] 0.0632561

Tetapi kita masih bisa melanjutkan.

 > pwr.p.test(sig.level=0.05, power=.8, h = ES.h(.001, 0), alt="greater", n = NULL)

 proportion power calculation for binomial distribution (arcsine transformation) 

          h = 0.0632561
          n = 1545.124
  sig.level = 0.05
      power = 0.8
alternative = greater

Dengan menggunakan nilai-nilai ini, Anda memerlukan setidaknya 1546 pengamatan.

Jessica
sumber

Dalam kasus spesifik Anda ada solusi tepat sederhana:

Di bawah hipotesis nol khusus Anda seharusnya tidak pernah mengamati kesuksesan. Jadi, begitu Anda mengamati satu keberhasilan, Anda dapat yakin bahwa . $H_0: p=0$ $p\neq0$

Di bawah alternatif Jumlah percobaan yang diperlukan untuk mengamati setidaknya 1 keberhasilan mengikuti distribusi geometrik. Jadi untuk mendapatkan ukuran sampel minimum untuk mencapai kekuatan , Anda harus menemukan k terkecil sehingga, $H_1: p=0.001$ $1-\beta$

1 - β \leq 1 - (1 - p)^{(k - 1)}

$1-\beta \leq 1-(1-p)^{(k-1)}$

Jadi dengan untuk mendapatkan daya Anda akan membutuhkan setidaknya 1610 sampel. $p=0.001$ $80%$

mengapung
sumber

Saat membaca komentar untuk solusi 1, saya menyadari bahwa ini pada dasarnya adalah solusi yang sama dengan yang Anda dapatkan jika tetap menjawabnya. Namun demikian, tidak ada salahnya untuk menguraikan beberapa hasil teori probabilitas dasar, tanpa perlu tiba di sana dengan intuisi.

mengapung