Saya baru-baru ini menemukan kertas "The Signifikansi Null Hypothesis Significance Testing", Jeff Gill (1999) . Penulis mengemukakan beberapa kesalahpahaman umum mengenai pengujian hipotesis dan nilai-p, yang saya punya dua pertanyaan spesifik:
- Nilai-p secara teknis , yang, sebagaimana ditunjukkan oleh makalah, umumnya tidak memberi tahu kita apa-apa tentang , kecuali kita tahu distribusi marjinal, yang jarang terjadi dalam pengujian hipotesis "setiap hari". Ketika kita memperoleh nilai p kecil dan "menolak hipotesis nol," apa sebenarnya pernyataan probabilistik yang kita buat, karena kita tidak bisa mengatakan apa-apa tentang ?P ( H 0 | o b s e r v a t i o n ) P ( H 0 | o b s e r v a t i o n )
- Pertanyaan kedua berkaitan dengan pernyataan tertentu dari halaman 6 (652) dari makalah ini:
Karena nilai-p, atau rentang nilai-p yang ditunjukkan oleh bintang-bintang, tidak disetel apriori, itu bukan probabilitas jangka panjang untuk membuat kesalahan Tipe I tetapi biasanya diperlakukan seperti itu.
Adakah yang bisa membantu menjelaskan apa yang dimaksud dengan pernyataan ini?
hypothesis-testing
p-value
gung - Reinstate Monica
sumber
sumber
Jawaban:
(Secara teknis, nilai-P adalah probabilitas untuk mengamati data setidaknya sama ekstrimnya dengan yang sebenarnya diamati, diberi hipotesis nol.)
Q1. Keputusan untuk menolak hipotesis nol berdasarkan nilai-P kecil biasanya tergantung pada 'disjungsi Fisher': Entah peristiwa langka telah terjadi atau hipotesis nol salah. Akibatnya, jarang terjadi apa yang P-value memberitahu Anda daripada probabilitas bahwa nol adalah salah.
Probabilitas bahwa nol adalah salah dapat diperoleh dari data eksperimen hanya dengan teorema Bayes, yang membutuhkan spesifikasi probabilitas 'sebelum' dari hipotesis nol (mungkin apa yang disebut Gill sebagai "distribusi marjinal").
Q2. Bagian dari pertanyaan Anda ini jauh lebih sulit daripada yang terlihat. Ada banyak kebingungan tentang nilai-P dan tingkat kesalahan yang, mungkin, apa yang dimaksud Gill dengan "tetapi biasanya diperlakukan seperti itu." Kombinasi nilai-nilai Fisher dengan tingkat kesalahan Neyman-Pearsonian telah disebut sebagai mishmash yang tidak koheren, dan sayangnya sangat luas. Tidak ada jawaban singkat yang akan sepenuhnya memadai di sini, tetapi saya dapat mengarahkan Anda ke beberapa makalah yang bagus (ya, satu milik saya). Keduanya akan membantu Anda memahami kertas Gill.
Hurlbert, S., & Lombardi, C. (2009). Keruntuhan akhir kerangka teori keputusan Neyman-Pearson dan kebangkitan neoFisherian. Annales Zoologici Fennici, 46 (5), 311–349. (Tautan ke kertas)
Lew, MJ (2012). Praktik statistik yang buruk dalam farmakologi (dan disiplin ilmu biomedis dasar lainnya): Anda mungkin tidak tahu P. British Journal of Farmacology, 166 (5), 1559-1567. doi: 10.1111 / j.1476-5381.2012.01931.x (Tautan ke kertas)
sumber
"the small p-value indicates that the sample mean(or regression coefficient, etc) is significantly different from zero"
? Sumber kebingungan tampaknya adalah bahwa tidak ada klaim probabilitas nyata yang dibuat untuk hipotesis nol ketika kita mengatakan nol adalah "ditolak."+1 ke @MichaelLew, yang telah memberi Anda jawaban yang bagus. Mungkin saya masih bisa berkontribusi dengan memberikan cara berpikir tentang Q2. Pertimbangkan situasi berikut:
sumber
...this fallacy shows up in statistics textbooks, as when Canavos and Miller (1999, p.255) stipulate: "If the null hypothesis is true, then a type I error occurs if (due to sampling error) the P-value is less than or equal to $alpha$"
Saya ingin membuat komentar terkait dengan "tidak signifikannya pengujian signifikansi nol hipotesis" tetapi tidak menjawab pertanyaan OP.
sumber