Nilai-p adalah probabilitas untuk memperoleh statistik yang setidaknya sama ekstrimnya dengan yang diamati dalam data sampel ketika mengasumsikan bahwa hipotesis nol () adalah benar.
Secara grafis ini sesuai dengan area yang ditentukan oleh statistik sampel di bawah distribusi sampling yang akan diperoleh ketika mengasumsikan :
Namun, karena bentuk dari distribusi yang diasumsikan ini sebenarnya didasarkan pada data sampel, maka dipusatkan pada sepertinya pilihan yang aneh bagi saya.
Jika seseorang akan menggunakan distribusi sampling dari statistik, yaitu memusatkan distribusi pada statistik sampel, maka pengujian hipotesis akan sesuai dengan memperkirakan probabilitas diberi sampel.
Dalam hal ini, nilai-p adalah probabilitas untuk memperoleh statistik paling tidak ekstrim diberikan data alih-alih definisi di atas.
Selain itu, interpretasi semacam itu memiliki keuntungan terkait dengan konsep interval kepercayaan:
Tes hipotesis dengan tingkat signifikansi akan sama dengan memeriksa apakah termasuk dalam interval kepercayaan dari distribusi sampling.
Dengan demikian saya merasa memusatkan distribusi bisa menjadi komplikasi yang tidak perlu.
Adakah pembenaran penting untuk langkah ini yang tidak saya pertimbangkan?
Jawaban:
Misalkan adalah sampel yang diambil dari distribusi normal dengan mean dan varian yang dikenal . Karena itu mean sampel normal dengan mean dan varians . Tentang ini banyak, saya pikir tidak mungkin ada ketidaksepakatan.X=(X1,X2,…,Xn) μ σ2 X¯ μ σ2/n
Sekarang, Anda mengusulkan bahwa statistik pengujian kami adalah Baik? TAPI INI BUKAN STATISTIK . Mengapa? Karena adalah parameter yang tidak dikenal . Statistik adalah fungsi dari sampel yang tidak bergantung pada parameter yang tidak diketahui. Oleh karena itu, asumsi harus dibuat tentang agar menjadi statistik. Salah satu asumsi tersebut adalah menulis di mana yang merupakan statistik.
Sebaliknya, Anda mengusulkan untuk menggunakan itu sendiri. Dalam hal ini, identik, dan itu bahkan bukan variabel acak, apalagi terdistribusi normal. Tidak ada yang bisa diuji.μ=X¯ Z=0
sumber
Ini sebenarnya tidak benar. Bentuk distribusi yang diasumsikan ini berasal dari menerima sebagai benar.H0
Sampel tidak terlibat langsung dalam hal itu, selain oleh beberapa asumsi.Menggunakan sampel secara langsung, tidak cukup. Anda juga perlu memiliki hipotesis nol.Pertanyaannya adalah: bagaimana Anda memperkirakan kemungkinan sesuatu yang Anda anggap benar. Dalam kasus kami jika Anda menganggap benar, tidak ada gunanya mencoba memperkirakan probabilitas bahwa benar.H0 H0
Anda tidak memiliki dua distribusi di sana, hanya ada satu, yang dianggap sebagai kebenaran dasar Anda, alias yang datang dengan . Namun ada distribusi sampling yang berasal dari sampel, tetapi ini tidak terlibat dalam hipotesis yang Anda gunakan.H0
Saya latihan yang baik adalah mencoba untuk mereplikasi logika yang sama dengan distribusi asimetris. Ambil distribusi chi-square seperti dalam uji independensi chi square. Apakah Anda dapat mereproduksinya? Saya kira jawabannya adalah tidak.
sumber
Dari apa yang saya kumpulkan, Anda berpendapat bahwa lebih masuk akal untuk 'membalik' dan .H0 H1
Saya merasa bermanfaat untuk menganggap pengujian hipotesis sebagai bukti dengan kontradiksi. Kami menganggap benar, kemudian menunjukkan bahwa bukti menunjukkan asumsi seperti itu cacat, sehingga membenarkan penolakan mendukung .H0 H0 H1
Ini berfungsi karena ketika kita mengasumsikan dan memusatkan distribusi kita di sana, kita dapat menentukan seberapa besar kemungkinan pengamatan kita. Misalnya, jika vs. dan kami menentukan dari pengujian kami bahwa ada kemungkinan kurang dari 5% bahwa rata-rata sebenarnya benar-benar sama dengan 0, kita dapat menolak dengan 95 % kepercayaanH0 H0:μ=0 H1:μ≠0 μ H0
Kebalikannya belum tentu benar. Katakanlah kita melakukan percobaan dan menentukan bahwa sebenarnya ada peluang 30% bahwa hipotesis nol masih berlaku. Kami tidak dapat menolak nol, tetapi kami juga tidak menerimanya . Situasi ini tidak menunjukkan bahwa (nol) adalah benar, tetapi kami tidak memiliki bukti untuk menunjukkan bahwa itu salah.H0
Sekarang bayangkan jika kita membalik situasi ini. Katakanlah kita mengasumsikan dan menemukan bahwa dengan hasil kami, kemungkinan adalah 5% atau kurang, apa artinya itu? Tentu kami dapat menolak nol, kami menerima ? Sulit untuk membenarkan menerima hal yang kita anggap benar pada awalnya.H1 H0 H1
Menunjukkan bahwa salah bukan hasil yang kita kejar; kami ingin berdebat mendukung . Dengan melakukan tes dengan cara yang Anda gambarkan, kami menunjukkan bahwa kami tidak memiliki bukti untuk mengatakan bahwa salah, yang sedikit berbeda dengan berargumen bahwa benar.H0 H1 H1 H1
sumber