Ketika "hipotesis nol" mencakup lebih dari satu keadaan alamiah, angka false positive (FPR) aktual dapat bervariasi dengan keadaan itu. Yang bisa kita lakukan adalah menjamin batasan pada FPR tidak peduli bagaimana keadaan alam itu - tetapi kita tidak selalu dapat menjamin FPR benar-benar sama dengan α .
(Ada alasan lain mengapa FPR mungkin tidak benar-benar sama dengan nilai yang ditargetkan , seperti ketika statistik uji diskrit. Situasi ini biasanya dapat disembuhkan dengan menggunakan prosedur keputusan acak. Dengan demikian, mereka tidak memberikan wawasan mendasar ke dalam pertanyaan.)α
Pertimbangkan uji satu sisi klasik di mana statistik diasumsikan memiliki distribusi Normal rata-rata tidak diketahui dan (untuk kesederhanaan) dikenal standar deviasi . harus dibandingkan dengan . Hipotesis nol adalah sedangkan hipotesis alternatif adalah . Wilayah penolakan karena itu dari bentukXμσμ0H0:μ≥0HA:μ<0
R(α)=(−∞,Zα]
tempat dipilih sehingga peluang untuk mengamati statistik di wilayah ini paling banyak :Zα α
α=sup(Pr(X∈R(α))).(1)
Berdasarkan asumsi, probabilitas ini diberikan oleh fungsi distribusi Normal :Φ
Pr(X∈R(α))=Φ(Zα−μσ).(2)
Probabilitas ini tergantung pada nilai tidak diketahui . μ Karena itu kami tidak dapat menjamin bahwa itu sebenarnya sama dengan . Memang, untuk besar , praktis nol. Namun, kami harus mencakup semua basis kami, dan menjamin bahwa selama konsisten dengan hipotesis nol, tingkat positif palsu tidak akan melebihi . αμ(2)μ(1)α
Ini masalah licik. Jika Anda memiliki data berkelanjutan, dan Anda memperlakukannya dengan tepat, maka . Namun, ketika data Anda diskrit, tidak mungkin untuk . Pertimbangkan data binomial tentang apakah koin itu adil, dengan 5 koin terbalik, kemungkinan nilai satu sisi adalah:Pr(p≤α|H0)=α p=α
Hanya kepala yang dapat menghasilkan kesalahan tipe I, dan probabilitas yang terkait dengan itu adalah . Jadi tingkat kesalahan tipe I akan dianggap "paling banyak ", tetapi tidak sama dengan .0 ≈0.03 α α
Di sisi lain, ada strategi analisis (tidak valid) yang mengarah ke tingkat kesalahan tipe I yang lebih besar dari , bahkan ketika (misalnya, rutinitas seleksi bertahap).α p<α
Saya memiliki diskusi yang lebih lengkap di sini: Membandingkan dan membandingkan, nilai-p, tingkat signifikansi dan kesalahan tipe I
sumber