Pengujian hipotesis. Mengapa memusatkan distribusi sampling pada H0?

9

Nilai-p adalah probabilitas untuk memperoleh statistik yang setidaknya sama ekstrimnya dengan yang diamati dalam data sampel ketika mengasumsikan bahwa hipotesis nol (H0) adalah benar.

Secara grafis ini sesuai dengan area yang ditentukan oleh statistik sampel di bawah distribusi sampling yang akan diperoleh ketika mengasumsikan H0:

pusat h0

Namun, karena bentuk dari distribusi yang diasumsikan ini sebenarnya didasarkan pada data sampel, maka dipusatkan pada μ0sepertinya pilihan yang aneh bagi saya.
Jika seseorang akan menggunakan distribusi sampling dari statistik, yaitu memusatkan distribusi pada statistik sampel, maka pengujian hipotesis akan sesuai dengan memperkirakan probabilitasμ0 diberi sampel.

pusat h1

Dalam hal ini, nilai-p adalah probabilitas untuk memperoleh statistik paling tidak ekstrimμ0 diberikan data alih-alih definisi di atas.

Selain itu, interpretasi semacam itu memiliki keuntungan terkait dengan konsep interval kepercayaan:
Tes hipotesis dengan tingkat signifikansiα akan sama dengan memeriksa apakah μ0 termasuk dalam (1α) interval kepercayaan dari distribusi sampling.

CI2 95

Dengan demikian saya merasa memusatkan distribusi μ0bisa menjadi komplikasi yang tidak perlu.
Adakah pembenaran penting untuk langkah ini yang tidak saya pertimbangkan?

matti
sumber
2
Tolong beritahu kami apa distribusi sampling akan menjadi jika Anda tidak berasumsiH0. (Jawab: Anda tidak bisa, kecuali dalam contoh buku teks di mana hipotesis alternatif menentukan distribusi yang unik.)
whuber
Saya tidak yakin apakah saya memahami permintaan dengan benar tetapi dalam contoh di atas itu akan menjadi distribusi sampling dari rata-rata. Saya sekarang telah menambahkan gambar untuk pertanyaan yang menunjukkan distribusi ini bersama dengan interval kepercayaan 95% / area yang juga harus membantu menggambarkan hubungan dengan interval kepercayaan.
matti
2
Anda tidak memiliki cara untuk mengetahui distribusi sampling mean. Untuk mengetahuinya, Anda perlu mengetahui nilai sebenarnya: tetapi itulah jumlah yang ingin Anda uji! Logika Anda sepenuhnya melingkar.
Whuber
1
Aku mengerti itu maksudmu. Secara umum, sampai Anda tahu - atau menganggap - parameter sebenarnya dari distribusi, Anda tidak dapat mengetahui distribusi properti sampel apa pun. (Faktanya, jika Anda dapat menyimpulkan distribusi properti sampel apa pun tanpa mengasumsikan pengetahuan tentang parameter, itu akan menjadi bukti bahwa itu tidak memberi Anda informasi tentang parameter!)
whuber
1
Saya tidak bisa, karena sepertinya Anda tidak menggunakan istilah seperti "berarti," "diperkirakan," atau bahkan "H0" dalam pengertian statistik mereka yang biasa. Saya benar-benar bingung untuk memahami apa pertanyaan Anda. Satu-satunya hal yang jelas adalah bahwa hal itu didasarkan pada kesalahpahaman pengujian hipotesis nol, tetapi tanggapan Anda terhadap komentar saya belum memberikan indikasi yang berguna tentang apa kesalahpahaman itu.
whuber

Jawaban:

5

Misalkan adalah sampel yang diambil dari distribusi normal dengan mean dan varian yang dikenal . Karena itu mean sampel normal dengan mean dan varians . Tentang ini banyak, saya pikir tidak mungkin ada ketidaksepakatan.X=(X1,X2,,Xn)μσ2X¯μσ2/n

Sekarang, Anda mengusulkan bahwa statistik pengujian kami adalah Baik? TAPI INI BUKAN STATISTIK . Mengapa? Karena adalah parameter yang tidak dikenal . Statistik adalah fungsi dari sampel yang tidak bergantung pada parameter yang tidak diketahui. Oleh karena itu, asumsi harus dibuat tentang agar menjadi statistik. Salah satu asumsi tersebut adalah menulis di mana yang merupakan statistik.

Z=X¯μσ/nNormal(0,1).
μμZ
H0:μ=μ0,vs.H1:μμ0,
ZH0=X¯μ0σ/nNormal(0,1),

Sebaliknya, Anda mengusulkan untuk menggunakan itu sendiri. Dalam hal ini, identik, dan itu bahkan bukan variabel acak, apalagi terdistribusi normal. Tidak ada yang bisa diuji.μ=X¯Z=0

heropup
sumber
1
Terima kasih. Ini sangat mudah dan sekarang saya benar-benar bertanya-tanya bagaimana saya bisa melewatkan itu sebelumnya. Semua yang tersisa sekarang sebagai alasan untuk kasus kedua yang disajikan adalah mengandalkan perhitungan interval kepercayaan. Namun, karena ada margin kesalahan secara eksplisit ditambahkan / dikurangi dari estimasi rata-rata atau poin, penggunaan estimasi itu menjadi langkah yang perlu dibenarkan.
matti
12

Namun, karena bentuk distribusi yang diasumsikan ini sebenarnya didasarkan pada data sampel, memusatkannya pada H0 sepertinya pilihan yang aneh bagi saya.

Ini sebenarnya tidak benar. Bentuk distribusi yang diasumsikan ini berasal dari menerima sebagai benar.H0Sampel tidak terlibat langsung dalam hal itu, selain oleh beberapa asumsi.Menggunakan sampel secara langsung, tidak cukup. Anda juga perlu memiliki hipotesis nol.

Jika seseorang akan menggunakan distribusi sampling dari statistik, yaitu memusatkan distribusi pada statistik sampel, maka pengujian hipotesis akan sesuai dengan memperkirakan probabilitas H0 yang diberikan sampel.

Pertanyaannya adalah: bagaimana Anda memperkirakan kemungkinan sesuatu yang Anda anggap benar. Dalam kasus kami jika Anda menganggap benar, tidak ada gunanya mencoba memperkirakan probabilitas bahwa benar.H0H0

Dengan demikian saya merasa bahwa memusatkan distribusi pada H0 adalah komplikasi yang tidak perlu.

Anda tidak memiliki dua distribusi di sana, hanya ada satu, yang dianggap sebagai kebenaran dasar Anda, alias yang datang dengan . Namun ada distribusi sampling yang berasal dari sampel, tetapi ini tidak terlibat dalam hipotesis yang Anda gunakan.H0

Saya latihan yang baik adalah mencoba untuk mereplikasi logika yang sama dengan distribusi asimetris. Ambil distribusi chi-square seperti dalam uji independensi chi square. Apakah Anda dapat mereproduksinya? Saya kira jawabannya adalah tidak.

rapaio
sumber
" Ini sebenarnya tidak benar. Bentuk distribusi yang diasumsikan ini berasal dari menerima H0 sebagai benar. Sampel tidak terlibat langsung dalam hal itu, selain oleh beberapa asumsi. " Tetapi dalam kasus uji-t satu sampel yang disajikan di atas, statistik uji termasuk SEM dan rata-rata sampel dan dengan demikian tergantung pada data sampel. Selanjutnya derajat kebebasan yang menentukan ketinggian ekor tergantung pada ukuran sampel.
t=x¯μ0sn
matti
1
Formulasi saya menyesatkan. Saya mencoba mengatakan bahwa Anda dapat menggunakan informasi apa pun yang Anda miliki, juga sampel itu sendiri, tetapi itu tidak cukup. Untuk mengevaluasi nilai-p dan memiliki distribusi Anda perlu mengasumsikan juga hipotesis nol. Saya juga merumuskan kembali dalam posting.
rapaio
1
... Ambil contoh rumus Anda untuk , ia menggunakan yang saya anggap itu nilai dari hipotesis noltμ0H0:μ=μ0
rapaio
2

Dari apa yang saya kumpulkan, Anda berpendapat bahwa lebih masuk akal untuk 'membalik' dan .H0H1

Saya merasa bermanfaat untuk menganggap pengujian hipotesis sebagai bukti dengan kontradiksi. Kami menganggap benar, kemudian menunjukkan bahwa bukti menunjukkan asumsi seperti itu cacat, sehingga membenarkan penolakan mendukung .H0H0H1

Ini berfungsi karena ketika kita mengasumsikan dan memusatkan distribusi kita di sana, kita dapat menentukan seberapa besar kemungkinan pengamatan kita. Misalnya, jika vs. dan kami menentukan dari pengujian kami bahwa ada kemungkinan kurang dari 5% bahwa rata-rata sebenarnya benar-benar sama dengan 0, kita dapat menolak dengan 95 % kepercayaanH0H0:μ=0H1:μ0μH0

Kebalikannya belum tentu benar. Katakanlah kita melakukan percobaan dan menentukan bahwa sebenarnya ada peluang 30% bahwa hipotesis nol masih berlaku. Kami tidak dapat menolak nol, tetapi kami juga tidak menerimanya . Situasi ini tidak menunjukkan bahwa (nol) adalah benar, tetapi kami tidak memiliki bukti untuk menunjukkan bahwa itu salah.H0

Sekarang bayangkan jika kita membalik situasi ini. Katakanlah kita mengasumsikan dan menemukan bahwa dengan hasil kami, kemungkinan adalah 5% atau kurang, apa artinya itu? Tentu kami dapat menolak nol, kami menerima ? Sulit untuk membenarkan menerima hal yang kita anggap benar pada awalnya.H1H0H1

Menunjukkan bahwa salah bukan hasil yang kita kejar; kami ingin berdebat mendukung . Dengan melakukan tes dengan cara yang Anda gambarkan, kami menunjukkan bahwa kami tidak memiliki bukti untuk mengatakan bahwa salah, yang sedikit berbeda dengan berargumen bahwa benar.H0H1H1H1

Bryan Goggin
sumber
Karena tes hipotesis tidak memungkinkan kita untuk menghilangkan ketidakpastian sepenuhnya, saya tidak akan melihatnya sebagai bukti . Mungkin saya tidak membuat poin saya cukup jelas tetapi saya pada dasarnya meminta alasan logis daripada semantik untuk menggeser distribusi sampel ke . H0
matti
Dan secara umum, H1 cukup samar (mu! = 0), membuat perhitungan kemungkinan bermasalah. Padahal saya kira itu sering kali merupakan insentif yang baik bagi orang untuk pergi ke Bayesian. :)
Hao Ye