Saya mengerti pengujian hipotesis dua sisi. Anda memiliki (vs. ). Nilai adalah probabilitas bahwa menghasilkan data setidaknya sama ekstrimnya dengan apa yang diamati.
Saya tidak mengerti pengujian hipotesis satu sisi. Di sini, (vs. ). Definisi nilai-p seharusnya tidak berubah dari atas: itu harus tetap menjadi probabilitas bahwa menghasilkan data setidaknya sama ekstrimnya dengan apa yang diamati. Tapi kita tidak tahu , hanya itu dibatasi oleh .
Jadi sebagai gantinya, saya melihat teks mengatakan kepada kami untuk berasumsi bahwa (bukan sesuai ) dan menghitung probabilitas bahwa ini menghasilkan data setidaknya sama ekstrimnya dengan apa yang diamati, tetapi hanya pada satu ujung . Ini tampaknya tidak ada hubungannya dengan hipotesis, secara teknis.
Sekarang, saya mengerti bahwa ini adalah pengujian hipotesis frequentist, dan frequentist tidak menempatkan prior pada mereka . Tetapi bukankah seharusnya itu hanya berarti bahwa hipotesis tidak mungkin diterima atau ditolak, alih-alih memasukkan perhitungan di atas ke dalam gambar?
sumber
Jawaban:
Itu pertanyaan yang masuk akal. Banyak teks (mungkin karena alasan pedagogis) yang membahas masalah ini. Apa yang sebenarnya terjadi adalah bahwa adalah komposit "hipotesis" dalam situasi satu sisi Anda: itu sebenarnya seperangkat hipotesis, tidak satu pun. Hal ini diperlukan bahwa untuk setiap hipotesis mungkin dalam H 0H0 H0 , kemungkinan statistik uji jatuh di wilayah kritis harus kurang dari atau sama dengan ukuran tes. Selain itu, jika tes sebenarnya untuk mencapai ukuran nominalnya (yang merupakan hal yang baik untuk mencapai daya tinggi), maka supremum peluang ini (diambil alih semua hipotesis nol) harus sama dengan ukuran nominal. Dalam praktiknya, untuk pengujian satu parameter sederhana dari lokasi yang melibatkan keluarga distribusi "baik" tertentu, supremum ini diperoleh untuk hipotesis dengan parameter . Dengan demikian, sebagai masalah praktis, semua perhitungan berfokus pada distribusi yang satu ini. Tapi kita tidak boleh melupakan sisa set H 0θ0 H0 : itu adalah perbedaan penting antara tes dua sisi dan satu sisi (dan antara tes "sederhana" dan "komposit" secara umum).
Ini secara halus mempengaruhi interpretasi hasil tes satu sisi. Ketika nol ditolak, kita dapat mengatakan bukti menunjuk pada keadaan sebenarnya dari setiap distribusi di . Ketika nol tidak ditolak, kita hanya bisa mengatakan ada distribusi dalam H 0 yang "konsisten" dengan data yang diamati. Kami tidak mengatakan bahwa semua distribusi di H 0 konsisten dengan data: jauh dari itu! Banyak dari mereka mungkin menghasilkan kemungkinan yang sangat rendah.H0 H0 H0
sumber
sumber
Anda akan menggunakan uji hipotesis satu sisi jika hanya hasil dalam satu arah yang mendukung kesimpulan yang ingin Anda capai.
Pikirkan ini dalam hal pertanyaan yang Anda ajukan. Misalkan, misalnya, Anda ingin melihat apakah obesitas menyebabkan peningkatan risiko serangan jantung. Anda mengumpulkan data Anda, yang mungkin terdiri dari 10 orang gemuk dan 10 orang tidak gemuk. Sekarang katakanlah, karena faktor pembaur yang tidak tercatat, desain eksperimental yang buruk, atau nasib buruk, Anda mengamati bahwa hanya 2 dari 10 orang gemuk mengalami serangan jantung, dibandingkan dengan 8 orang yang tidak gemuk.
Sekarang jika Anda melakukan tes hipotesis 2-sisi pada data ini, Anda akan menyimpulkan bahwa ada hubungan yang signifikan secara statistik (p ~ 0,02) antara obesitas dan risiko serangan jantung. Namun, asosiasi akan berada di arah yang berlawanan dengan apa yang sebenarnya Anda harapkan untuk dilihat, maka hasil tes akan menyesatkan.
(Dalam kehidupan nyata, percobaan yang menghasilkan hasil yang berlawanan dengan intuisi dapat menimbulkan pertanyaan lebih lanjut yang menarik dalam diri mereka sendiri: misalnya, proses pengumpulan data mungkin perlu ditingkatkan, atau mungkin ada faktor risiko yang sebelumnya tidak diketahui di tempat kerja, atau mungkin kebijaksanaan konvensional hanya keliru. Tetapi masalah ini tidak benar-benar terkait dengan pertanyaan sempit tentang tes hipotesis seperti apa yang digunakan.)
sumber
Anda dapat bereksperimen dengan contoh mainan ini di R sendiri, Anda juga harus mencoba angka absolut dan kombinasi kepala dan ekor yang berbeda:
sumber