Apakah mungkin membuktikan hipotesis nol?

37

Seperti yang dinyatakan dalam pertanyaan - Apakah mungkin untuk membuktikan hipotesis nol? Dari pemahaman hipotesis saya yang terbatas, jawabannya adalah tidak, tetapi saya tidak dapat memberikan penjelasan yang tepat untuk itu. Apakah pertanyaannya memiliki jawaban pasti?

Pulkit Sinha
sumber
4
Itu tergantung pada apa yang Anda maksud dengan "membuktikan." Seperti yang dinyatakan, ini adalah pertanyaan filosofis, bukan pertanyaan statistik, dan tidak memiliki jawaban pasti (walaupun, setidaknya sejak masa David Hume, kebanyakan orang akan menjawab "tidak").
whuber
Ini agak pertanyaan yang keliru. Kita perlu mengetahui kondisi di mana "bukti" ini terjadi.
probabilityislogic
Mungkin pertanyaan yang diajukan lebih baik adalah "Di bawah kondisi / asumsi apa yang memungkinkan untuk membuktikan hipotesis nol?"
probabilityislogic

Jawaban:

19

Jika Anda berbicara tentang dunia nyata & bukan logika formal, jawabannya tentu saja. "Bukti" dari segala sesuatu dengan cara empiris tergantung pada kekuatan kesimpulan yang dapat dibuat, yang pada gilirannya ditentukan oleh validitas proses pengujian sebagaimana dievaluasi dalam terang segala sesuatu yang diketahui tentang bagaimana dunia bekerja (yaitu, teori). Setiap kali seseorang menerima bahwa hasil-hasil empiris tertentu membenarkan penolakan terhadap hipotesis "nol", seseorang harus membuat penilaian semacam ini (validitas desain; dunia bekerja dengan cara tertentu), sehingga harus membuat asumsi analog yang diperlukan untuk membenarkan menyimpulkan "bukti dari" null " tidak bermasalah sama sekali.

Jadi, apa asumsi analog? Berikut adalah contoh "membuktikan nol" yang umum dalam ilmu kesehatan & dalam ilmu sosial. (1) Tentukan "null" atau "no effect" dengan cara yang secara praktis bermakna. Katakanlah saya percaya bahwa saya harus melakukan diri sendiri seolah-olah tidak ada perbedaan yang berarti antara 2 perawatan, t1 & t2, untuk penyakit kecuali satu memberikan peluang 3% lebih baik untuk sembuh daripada yang lain. (2) Mencari tahu desain yang valid untuk menguji apakah ada efek - dalam kasus ini, apakah ada perbedaan dalam kemungkinan pemulihan antara t1 & t2. (3) Lakukan analisis daya untuk menentukan apakah ukuran sampel apa yang diperlukan untuk menghasilkan kemungkinan yang cukup tinggi - yang saya yakini mengandalkan apa yang diberikan 'dengan asumsi itu ada. Biasanya orang mengatakan kekuatan sudah cukup jika kemungkinan mengamati efek yang ditentukan pada alpha tertentu setidaknya 0,80, tetapi tingkat kepercayaan yang benar sebenarnya adalah masalah seberapa benci Anda terhadap kesalahan - sama seperti ketika Anda memilih p -nilai ambang batas untuk "menolak nol." (4) Lakukan tes empiris & amati efeknya. Jika di bawah nilai "perbedaan bermakna" yang ditentukan - 3% dalam contoh saya - Anda telah "membuktikan" bahwa tidak ada "efek".

Untuk perawatan yang baik untuk masalah ini, lihat Streiner, DL Unicorns Do Exist: Tutorial tentang “Membuktikan” Hipotesis Null . Canadian Journal of Psychiatry 48, 756-761 (2003).

dmk38
sumber
1
+1. Ini adalah contoh yang bagus tentang pentingnya kejelasan tentang standar "bukti" seseorang. Dalam banyak aplikasi yang Anda panggil di sini - standar "bertindak seolah-olah", jika saya boleh menyebutnya begitu - sangat lemah sehingga tidak ada yang mau menerimanya sebagai "bukti." Saya tidak menyangkal manfaatnya, dan mendukung pendekatan semacam ini untuk mendukung pengambilan keputusan yang rasional. (Tapi mungkin metode Bayesian lebih baik ... :-)
whuber
1
(+1) Jawaban yang bagus. Saya menambahkan tautan ke versi online artikel Streiner; Saya harap Anda tidak keberatan (merasa bebas untuk menghapus).
chl
1
beberapa hal lagi: (1) Memperlakukan kegagalan untuk menolak nol sebagai bukti yang mendukung nol adalah kesalahan yang sangat umum & kejadian biasa untuk poin Streiner. Kesalahan ini pada dasarnya mengubah keengganan yang kuat untuk mengetik kesalahan 1 dalam "p <0,05" norma menjadi lisensi untuk membuat tipe 2. S mengatakan, "tunggu - Anda membutuhkan kekuatan ..." (2) Whuber mengutip argumen terkenal Hume. Ht pt sebenarnya hanya sebagai subversif dari bukti empiris yang menolak nol sebagai bukti dari nol. H mengatakan induksi tidak dapat mendukung inferensi kausal. Baik; tetapi tidak ada alternatif untuk studi empiris! Go Pearl (& Bayes), bukan Hume, tentang hubungan sebab akibat!
dmk38
1
pertanyaan tentang pengujian kesetaraan ini juga memiliki beberapa saran yang bagus, stats.stackexchange.com/questions/3038/…
Jeromy Anglim
Apakah ini setara dengan menganggap "bukan nol" sebagai hipotesis nol baru dan kemudian menolak hipotesis nol baru ini?
16

Jawaban dari sisi matematika: adalah mungkin jika dan hanya jika "hipotesis adalah satu sama lain".

Jika dengan "membuktikan" maksud Anda memiliki aturan yang dapat "menerima" (harus saya katakan itu :)) H0 dengan probabilitas untuk membuat kesalahan yang nol, maka Anda sedang mencari apa yang bisa disebut "tes ideal" dan ini ada:

Jika Anda menguji apakah variabel acak diambil dari P 0 atau dari P 1 (yaitu pengujian H 0 : X P 0 versus H 1 : X P 1 ) maka ada tes yang ideal jika dan hanya jika P 1P 0 ( P 1 dan P 0 adalah "satu sama lain"). XP0P1H0:XP0H1:XP1 P1P0P1P0

Jika Anda tidak tahu apa artinya "saling tunggal" saya dapat memberi Anda sebuah contoh: dan U [ 3 , 4 ] (seragam pada [ 0 , 1 ] dan [ 3 , 4 ] ) adalah satu sama lain . Ini berarti jika Anda ingin mengujiU[0,1]U[3,4][0,1][3,4]

versus H 1 : X U [ 3 , 4 ]H0:XU[0,1]H1:XU[3,4]

maka ada tes yang ideal (tebak apa itu :)): tes yang tidak pernah salah!

Jika dan P 0 tidak saling tunggal, maka ini tidak ada (ini hasil dari "hanya jika bagian")!P1P0

Dalam istilah non-matematika, ini berarti bahwa Anda dapat membuktikan nol jika dan hanya jika buktinya sudah ada dalam asumsi Anda (yaitu jika dan hanya jika Anda telah memilih hipotesis dan H 1 yang sangat berbeda sehingga pengamatan tunggal dari H 0 tidak dapat diidentifikasi sebagai satu dari H 1 dan sebaliknya). H0H1H0H1

robin girard
sumber
4
+1 Jawaban yang bagus. Render sederhana dari matematika adalah bahwa nol dan alternatifnya diasumsikan menghasilkan set hasil yang terpisah; misalnya, ada zebra di ruangan ini atau tidak ada. Tentu saja "buktikan" di sini secara implisit termasuk "bersyarat pada model," yang dengan sendirinya tidak pernah dibangun dengan ketelitian yang sama seperti, katakanlah, sebuah teorema matematika; itu secara implisit termasuk "bersyarat pada keakuratan pengamatan;" dan secara implisit termasuk bahwa hipotesis dapat ditafsirkan secara ambigu. (Untuk kritik terhadap yang terakhir, lihat Buku Wanita, Api, dan Hal-Hal Berbahaya George Lakoff . )
whuber
11

Ya ada jawaban yang pasti. Jawaban itu adalah: Tidak, tidak ada cara untuk membuktikan hipotesis nol. Yang terbaik yang dapat Anda lakukan, sejauh yang saya tahu, adalah membuang interval kepercayaan di sekitar perkiraan Anda dan menunjukkan bahwa pengaruhnya sangat kecil sehingga mungkin pada dasarnya tidak ada.

russellpierce
sumber
4
Lebih umum masalah dalam statistik bukanlah bahwa Anda tidak dapat membuktikan hipotesis nol, itu adalah bahwa Anda tidak dapat membuat estimasi titik dengan pasti. Yaitu, sama seperti Anda tidak bisa mengatakan "tidak ada efek dari variabel" Anda tidak dapat mengatakan bahwa "ukuran efek dari variabel adalah 1,95". Statistik selalu memiliki interval kepercayaan.
russellpierce
1
Setuju bahwa jawabannya adalah TIDAK besar, dan untuk alasan yang sangat kuat: dengan membangun hipotesis statistik. Fakta bahwa jawaban yang diterima mengklaim sebaliknya benar-benar tragis. Apa yang diberikan pengujian hipotesis sebagai jawaban adalah: dengan asumsi hipotesis saya benar , apakah data yang saya sampel konsisten dengannya? Dan tidak berarti sebaliknya. Tidak perlu banyak alasan untuk memahami bahwa Anda tidak dapat menyimpulkan dari apakah hipotesis itu benar atau tidak.
Christophe
4

Bagi saya, kerangka teori keputusan menyajikan cara termudah untuk memahami "hipotesis nol". Pada dasarnya dikatakan bahwa setidaknya harus ada dua alternatif: hipotesis Null, dan setidaknya satu alternatif. Maka "masalah keputusan" adalah menerima salah satu alternatif, dan menolak yang lain (walaupun kita harus tepat tentang apa yang kita maksudkan dengan "menerima" dan "menolak" hipotesis). Saya melihat pertanyaan "bisakah kita membuktikan hipotesis nol?" sebagai analog dengan "bisakah kita selalu membuat keputusan yang benar?". Dari perspektif teori keputusan, jawabannya jelas ya jika

1) tidak ada ketidakpastian dalam proses pengambilan keputusan, karena itu adalah latihan matematika untuk mencari tahu apa keputusan yang benar.

2) kami menerima semua premis / asumsi masalah lainnya. Yang paling kritis (saya pikir) adalah bahwa hipotesis yang kami putuskan adalah lengkap, dan satu (dan hanya satu) dari mereka harus benar, dan yang lain harus salah.

Dari sudut pandang yang lebih filosofis, tidak mungkin untuk "membuktikan" apa pun, dalam arti bahwa "bukti" sepenuhnya tergantung pada asumsi / aksioma yang mengarah pada "bukti" itu. Saya melihat bukti sebagai semacam kesetaraan logis daripada "fakta" atau "kebenaran" dalam arti bahwa jika buktinya salah, asumsi yang menyebabkannya juga salah.

Menerapkan ini ke "membuktikan hipotesis nol" Saya bisa "membuktikan" itu benar dengan hanya mengasumsikan bahwa itu benar, atau dengan mengasumsikan bahwa itu benar jika kondisi tertentu terpenuhi (seperti nilai statistik).

probabilityislogic
sumber
3

Ya, adalah mungkin untuk membuktikan nol - dalam arti yang persis sama bahwa mungkin untuk membuktikan alternatif apa pun ke nol. Dalam analisis Bayesian, sangat mungkin untuk peluang yang mendukung nol versus alternatif yang diusulkan untuk menjadi besar secara sewenang-wenang. Selain itu, adalah salah untuk menyatakan, karena beberapa jawaban di atas menyatakan, bahwa seseorang hanya dapat membuktikan nol jika alternatifnya terpisah (jangan tumpang tindih dengan nol). Dalam analisis Bayesian setiap hipotesis memiliki distribusi probabilitas sebelumnya. Distribusi ini menyebarkan massa satuan probabilitas sebelumnya di atas alternatif yang diusulkan. Hipotesis nol menempatkan semua probabilitas sebelumnya pada satu alternatif. Pada prinsipnya, alternatif ke nol dapat menempatkan semua probabilitas sebelumnya pada beberapa alternatif non-nol (pada "titik" lain), tapi ini jarang terjadi. Secara umum, alternatif lindung nilai, yaitu, mereka menyebarkan massa probabilitas yang sama sebelumnya keluar atas alternatif lain - baik dengan mengesampingkan alternatif nol, atau, lebih umum, termasuk alternatif nol. Pertanyaannya kemudian menjadi hipotesis mana yang menempatkan probabilitas paling sebelumnya di mana data eksperimental benar-benar jatuh. Jika data jatuh dengan ketat di sekitar di mana nol mengatakan mereka harus jatuh, maka itu akan menjadi odds-on favority (di antara hipotesis yang diajukan) BAHKAN BAHWA ITU TERMASUK DALAM (NESTED IN, TIDAK MUTUALLY SECARA EKSKLUSIF DENGAN) ALTERNATIF KEPADA ITU. Percaya bahwa tidak mungkin bagi alternatif bersarang untuk menjadi lebih mungkin daripada set di mana ia bersarang mencerminkan kegagalan untuk membedakan antara probabilitas dan kemungkinan. Walaupun tidak mungkin untuk komponen himpunan menjadi kurang mungkin daripada seluruh himpunan, sangat mungkin untuk kemungkinan posterior komponen himpunan hipotesis lebih besar daripada kemungkinan posterior himpunan secara keseluruhan. Kemungkinan posterior suatu hipotesis adalah produk dari fungsi kemungkinan dan distribusi probabilitas sebelumnya yang diajukan hipotesis. Jika suatu hipotesis menempatkan semua probabilitas sebelumnya di tempat yang tepat (misalnya, pada nol), maka ia akan memiliki kemungkinan posterior lebih tinggi daripada hipotesis yang menempatkan beberapa probabilitas sebelumnya di tempat yang salah (bukan pada nol). Kemungkinan posterior suatu hipotesis adalah produk dari fungsi kemungkinan dan distribusi probabilitas sebelumnya yang diajukan hipotesis. Jika suatu hipotesis menempatkan semua probabilitas sebelumnya di tempat yang tepat (misalnya, pada nol), maka ia akan memiliki kemungkinan posterior lebih tinggi daripada hipotesis yang menempatkan beberapa probabilitas sebelumnya di tempat yang salah (bukan pada nol). Kemungkinan posterior suatu hipotesis adalah produk dari fungsi kemungkinan dan distribusi probabilitas sebelumnya yang diajukan hipotesis. Jika suatu hipotesis menempatkan semua probabilitas sebelumnya di tempat yang tepat (misalnya, pada nol), maka ia akan memiliki kemungkinan posterior lebih tinggi daripada hipotesis yang menempatkan beberapa probabilitas sebelumnya di tempat yang salah (bukan pada nol).


sumber
2

Secara teknis, tidak, hipotesis nol tidak dapat dibuktikan. Untuk setiap ukuran sampel yang tetap dan terbatas, akan selalu ada beberapa ukuran efek yang kecil tetapi tidak nol yang uji statistik Anda hampir tidak memiliki kekuatan. Namun, yang lebih praktis, Anda dapat membuktikan bahwa Anda berada dalam beberapa epsilon kecil dari hipotesis nol, sehingga penyimpangan yang lebih kecil dari epsilon ini secara praktis tidak signifikan.

dsimcha
sumber
2

Ada kasus di mana bukti dimungkinkan. Misalkan Anda memiliki sekolah dan hipotesis nol Anda adalah bahwa jumlah anak laki-laki dan perempuan sama. Ketika ukuran sampel meningkat, ketidakpastian dalam rasio anak laki-laki dan perempuan cenderung berkurang, akhirnya mencapai kepastian (yang saya anggap Anda maksud dengan bukti) ketika seluruh populasi murid dijadikan sampel.

Tetapi jika Anda tidak memiliki populasi terbatas, atau jika Anda mengambil sampel dengan penggantian dan tidak dapat menemukan individu yang telah diamplas, maka Anda tidak dapat mengurangi ketidakpastian menjadi nol dengan sampel terbatas.

Henry
sumber
0

Saya ingin membahas di sini poin yang banyak pengguna agak bingung. Apa arti sebenarnya dari pernyataan Hipotesis Null H0: p = 0? Apakah kita mencoba menentukan apakah parameter p adalah nol? Tentu saja tidak, tidak ada cara untuk mencapai tujuan seperti itu.

Apa yang ingin kami buat adalah bahwa, mengingat set data, nilai parameter yang dievaluasi (atau tidak) tidak terlihat dari nol. Ingat bahwa NHST "tidak adil" terhadap hipotesis alternatif: nol dianggap berasal dari Tingkat Kepercayaan 95%, dan hanya 5% ke alternatif. Karena itu hasil "tidak signifikan" tidak berarti bahwa H0 berlaku tetapi hanya bahwa kami tidak menemukan bukti yang cukup bahwa alternatifnya mungkin.

lisensi
sumber