Saya bertanya-tanya apakah ada yang bisa memberikan ikhtisar singkat tentang definisi dan penggunaan nilai-p, tingkat signifikansi dan kesalahan tipe I.
Saya mengerti bahwa nilai-p didefinisikan sebagai "probabilitas untuk memperoleh statistik uji setidaknya sama ekstrimnya dengan yang kami amati", sementara tingkat signifikansi hanyalah nilai batas yang sewenang-wenang untuk mengukur apakah nilai-p signifikan atau tidak. . Kesalahan tipe I adalah kesalahan menolak hipotesis nol yang benar. Namun, saya tidak yakin mengenai perbedaan antara tingkat signifikansi dan kesalahan tipe I, bukankah konsepnya sama?
Misalnya, asumsikan percobaan yang sangat sederhana di mana saya melempar koin 1000 kali dan menghitung berapa kali ia mendarat di 'kepala'. Hipotesis nol saya, H0, adalah bahwa kepala = 500 (koin tidak bias). Saya kemudian menetapkan tingkat signifikansi saya pada alpha = 0,05.
Saya membalik koin 1000 kali dan kemudian saya menghitung nilai-p, jika nilai-p> 0,05 maka saya gagal menolak hipotesis nol dan jika nilai-p <<0,05 maka saya menolak hipotesis nol.
Sekarang jika saya melakukan percobaan ini berulang kali, setiap kali menghitung nilai p dan menolak atau gagal menolak hipotesis nol dan menghitung berapa banyak saya menolak / gagal menolak, maka saya akhirnya akan menolak 5% hipotesis nol yang pada kenyataannya benar, apakah itu benar? Ini adalah definisi kesalahan tipe I. Oleh karena itu, tingkat signifikansi dalam pengujian signifikansi Fisher pada dasarnya adalah kesalahan tipe I dari pengujian hipotesis Neyman-Pearson jika Anda melakukan percobaan berulang.
Sekarang untuk nilai-p, jika saya mendapatkan nilai-p dari 0,06 dari percobaan terakhir saya dan saya melakukan beberapa percobaan dan menghitung semua yang saya dapatkan nilai p dari 0 hingga 0,06, maka saya juga tidak akan memiliki 6% kemungkinan menolak hipotesis nol sejati?
Anda mendapatkan jawaban yang bagus di sini dari @MansT & @ gui11aume (masing-masing +1). Biarkan saya melihat apakah saya bisa mendapatkan sesuatu yang lebih eksplisit di kedua jawaban mereka.
Mungkin ada kasus di mana nilai p yang dihitung tidak sama dengan tingkat kesalahan tipe I jangka panjang, selain fakta bahwa tingkat kesalahan tipe I tidak selalu sama dengan tingkat signifikansi. Pertimbangkan tabel kontingensi 2x2 dengan jumlah yang diamati ini:
Dengan demikian, masalah di sini adalah bahwa, dengan data diskrit:
(Meskipun pertanyaannya tidak menanyakan solusi untuk masalah ini) ada beberapa hal yang mengurangi masalah ini:
sumber
Konsep-konsep tersebut memang terkait erat satu sama lain.
Nilai-p adalah tingkat signifikansi terendah di mana hipotesis nol akan diterima . Dengan demikian ia memberi tahu kita "seberapa penting" hasilnya.
sumber