Apakah tingkat kesalahan tipe I sama dengan alpha atau paling banyak alpha?

8

Menurut halaman Wikipedia p-value :

Ketika nilai-p dihitung dengan benar, tes ini menjamin bahwa tingkat kesalahan Tipe I paling banyak .α

Namun lebih jauh ke bawah halaman formula ini diberikan:

Pr(RejectH|H)=Pr(pα|H)=α

Dengan asumsi 'tingkat kesalahan tipe 1' = Pr(RejectH|H) ini menunjukkan bahwa tingkat kesalahan tipe 1 adalah α dan bukan 'paling banyak α '. Kalau tidak, rumusnya akan berbunyi:

Pr(RejectH|H)α

Di mana kesalahpahaman saya?

telur
sumber

Jawaban:

8

Ketika "hipotesis nol" mencakup lebih dari satu keadaan alamiah, angka false positive (FPR) aktual dapat bervariasi dengan keadaan itu. Yang bisa kita lakukan adalah menjamin batasan pada FPR tidak peduli bagaimana keadaan alam itu - tetapi kita tidak selalu dapat menjamin FPR benar-benar sama dengan α .

(Ada alasan lain mengapa FPR mungkin tidak benar-benar sama dengan nilai yang ditargetkan , seperti ketika statistik uji diskrit. Situasi ini biasanya dapat disembuhkan dengan menggunakan prosedur keputusan acak. Dengan demikian, mereka tidak memberikan wawasan mendasar ke dalam pertanyaan.)α


Pertimbangkan uji satu sisi klasik di mana statistik diasumsikan memiliki distribusi Normal rata-rata tidak diketahui dan (untuk kesederhanaan) dikenal standar deviasi . harus dibandingkan dengan . Hipotesis nol adalah sedangkan hipotesis alternatif adalah . Wilayah penolakan karena itu dari bentukXμσμ0H0:μ0HA:μ<0

R(α)=(,Zα]

tempat dipilih sehingga peluang untuk mengamati statistik di wilayah ini paling banyak :Zα α

(1)α=sup(Pr(XR(α))).

Berdasarkan asumsi, probabilitas ini diberikan oleh fungsi distribusi Normal :Φ

(2)Pr(XR(α))=Φ(Zαμσ).

Probabilitas ini tergantung pada nilai tidak diketahui . μ Karena itu kami tidak dapat menjamin bahwa itu sebenarnya sama dengan . Memang, untuk besar , praktis nol. Namun, kami harus mencakup semua basis kami, dan menjamin bahwa selama konsisten dengan hipotesis nol, tingkat positif palsu tidak akan melebihi . αμ(2)μ(1)α

whuber
sumber
1
@ JackPierce-Brown Formula ini benar untuk hipotesis titik nol dan untuk statistik uji kontinu. Itulah yang harus diasumsikan dalam artikel Wikipedia, tetapi mungkin tidak dijabarkan. (+1)
amoeba
1
@Amoeba benar. Perhatikan, sebagai tambahan, bahwa hanya beberapa tes praktis yang benar-benar melibatkan hipotesis titik Null. Bahkan Student t-test vs bukan merupakan titik Null, karena ada banyak kemungkinan untuk nilai parameter yang tidak diketahui meskipun angka nol menurunkan nilainya dari . H0:μ=0 HA:μ>0σμ
whuber
1
@whuber Hmm, contoh uji-t Anda membingungkan. Bisakah Anda menguraikan? Saya pikir adalah titik nol, karena adalah titik, dan tidak memasukkan hipotesis nol. Jika bukan titik nol, apakah itu berarti tingkat kesalahan tipe I tidak sama dengan ? Saya akan berpikir itu harus sama dengan tidak peduli apa itu. H0=00σαασ
amoeba
2
@Amoeba adalah bagian dari hipotesis nol. Dengan ketat, ruang parameter adalahHipotesis nol adalah subsetItu bukan satu-satunya keadaan alam. Tapi mungkin ini bukan contoh terbaik, karena distribusi statistik tidak bergantung pada : itu sebabnya FPR konstan dimungkinkan. σ
Θ={(μ,σ)μR,σ0}.
H0={(μ,σ)μ=0,σ0}Θ.
tσ
Whuber
1
Menarik. Saya melihat.
amoeba
4

Ini masalah licik. Jika Anda memiliki data berkelanjutan, dan Anda memperlakukannya dengan tepat, maka . Namun, ketika data Anda diskrit, tidak mungkin untuk . Pertimbangkan data binomial tentang apakah koin itu adil, dengan 5 koin terbalik, kemungkinan nilai satu sisi adalah: Pr(pα|H0)=αp=α

> pbinom(0:5, size=5, prob=.5)
[1] 0.03125 0.18750 0.50000 0.81250 0.96875 1.00000

Hanya kepala yang dapat menghasilkan kesalahan tipe I, dan probabilitas yang terkait dengan itu adalah . Jadi tingkat kesalahan tipe I akan dianggap "paling banyak ", tetapi tidak sama dengan . 00.03α α

Di sisi lain, ada strategi analisis (tidak valid) yang mengarah ke tingkat kesalahan tipe I yang lebih besar dari , bahkan ketika (misalnya, rutinitas seleksi bertahap). αp<α

Saya memiliki diskusi yang lebih lengkap di sini: Membandingkan dan membandingkan, nilai-p, tingkat signifikansi dan kesalahan tipe I

gung - Pasang kembali Monica
sumber