Apa perbedaan antara interval kepercayaan dan pengujian hipotesis?

Saya telah membaca tentang kontroversi mengenai pengujian hipotesis dengan beberapa komentator yang menyarankan bahwa pengujian hipotesis tidak boleh digunakan. Beberapa komentator menyarankan agar interval kepercayaan sebaiknya digunakan.

Apa perbedaan antara interval kepercayaan dan pengujian hipotesis? Penjelasan dengan referensi dan contoh akan sangat dihargai.

hypothesis-testing confidence-interval statistik cinta
sumber

Saya pikir Anda ingin bertanya mengapa melaporkan hasil pengujian hipotesis dengan menunjukkan interval kepercayaan lebih baik daripada hanya mengatakan sesuatu dikonfirmasi atau ditolak pada tingkat p-value tertentu.

Anda harus mempertimbangkan memeriksa beberapa pertanyaan Anda lainnya sebagai dijawab.

Andy W

Jawaban:

Anda dapat menggunakan interval kepercayaan diri (CI) untuk pengujian hipotesis. Dalam kasus khusus, jika CI untuk efek tidak menjangkau 0 maka Anda dapat menolak hipotesis nol. Tetapi CI dapat digunakan untuk lebih, sedangkan melaporkan apakah telah lulus adalah batas kegunaan tes.

Alasan Anda disarankan untuk menggunakan CI daripada hanya uji-t, misalnya, adalah karena Anda dapat melakukan lebih dari sekadar menguji hipotesis. Anda dapat membuat pernyataan tentang rentang efek yang Anda yakini kemungkinan (yang ada di CI). Anda tidak dapat melakukan itu hanya dengan uji-t. Anda juga dapat menggunakannya untuk membuat pernyataan tentang nol, yang tidak dapat Anda lakukan dengan uji-t. Jika uji-t tidak menolak nol maka Anda hanya mengatakan bahwa Anda tidak bisa menolak nol, yang tidak banyak bicara. Tetapi jika Anda memiliki interval kepercayaan sempit di sekitar nol maka Anda dapat menyarankan bahwa nol, atau nilai yang dekat dengannya, kemungkinan adalah nilai sebenarnya dan menyarankan pengaruh perlakuan, atau variabel independen, terlalu kecil untuk bermakna ( atau bahwa percobaan Anda tidak

Ditambahkan kemudian: Saya benar-benar harus mengatakan itu, sementara Anda dapat menggunakan CI seperti tes itu bukan salah Ini merupakan perkiraan rentang tempat Anda berpikir nilai parameter berada. Anda dapat membuat tes seperti kesimpulan tetapi Anda jauh lebih baik tidak pernah membicarakannya seperti itu.

Mana yang lebih baik?

A) Efeknya adalah 0,6, t (29) = 2,8, p <0,05. Efek signifikan secara statistik ini adalah ... (beberapa diskusi terjadi tentang signifikansi statistik ini tanpa menyebutkan atau bahkan kemampuan yang kuat untuk membahas implikasi praktis dari besarnya temuan ... di bawah kerangka kerja Neyman-Pearson besarnya t dan nilai p hampir tidak berarti dan yang dapat Anda diskusikan adalah apakah efeknya ada atau tidak ada. Anda tidak pernah bisa benar-benar berbicara tentang tidak ada efek berdasarkan tes.)

atau

B) Menggunakan interval kepercayaan 95% saya memperkirakan efeknya antara 0,2 dan 1,0. (beberapa diskusi terjadi kemudian berbicara tentang efek yang sebenarnya menarik, apakah itu nilai-nilai yang masuk akal adalah orang-orang yang memiliki makna tertentu dan setiap penggunaan kata signifikan untuk persis apa yang seharusnya artinya. Selain itu, lebar CI dapat langsung menuju ke diskusi tentang apakah ini merupakan temuan yang kuat atau apakah Anda hanya dapat mencapai kesimpulan yang lebih tentatif)

Jika Anda mengambil kelas statistik dasar, Anda mungkin pada awalnya tertarik ke A. Dan mungkin ada beberapa kasus di mana itu adalah cara yang lebih baik untuk melaporkan hasilnya. Tetapi untuk sebagian besar pekerjaan B jauh lebih unggul. Perkiraan rentang bukan tes.

John
sumber

Satu tambahan untuk komentar @john: Pertama, kadang-kadang pertanyaan kuncinya adalah apakah CI mencakup 1, bukan 0 (mis. Regresi logistik).

Peter Flom - Reinstate Monica

Guys, ini 1 atau 0? (Ini terlihat sangat mencerahkan bagi saya, jadi saya kira, saya perlu belajar nilai yang benar untuk diwaspadai!) @ John

Adhesh Josh

Apa hubungan antara 95% CI dan hipotesis pengujian dua sisi dengan alfa = 0,05? apakah mereka sama? jika tidak maka bagaimana?

statistik cinta

love-stats, ketika digunakan sama mereka sama.

John

Adhesh Josh, hipotesis nol dapat berupa nilai tetap yang ditentukan sebelumnya. Itu fitur lain dari CI melalui NHST lurus. Ini sangat mudah digunakan ketika Anda ingin menguji terhadap nilai hipotetis selain 0.

John

$x_1, x_2, \ldots, x_n$ $\mu$ $\mathcal N(\mu,1)$ $\mu = m$ $H_0: \mu = m$ $0.05.$ $v = (x_1 + x_2 + \cdots + x_n ) / n$ $A(m)$ $v$ $A(m)$ $v$ $\mu=m$ $\mathcal N(m,1)$ $\mu$ $m$ $v$ $A(m)$ $m$ $v$ $0$ $\mu = 0$

$v$ $\mu$ $m$ $\mu=m$ $0.05.$ $m$ $\mu=m$ $0.02$ $1-0.98$

DavidR
sumber

Harap baca ini karena nilai-p tidak dapat diartikan sebagai tingkat tes terkecil untuk menolak nol. "Telah ditunjukkan bahwa menafsirkan nilai p dalam percobaan tunggal (atau yang sedang berlangsung) tidak diizinkan dalam konteks pengujian hipotesis Neyman-Pearson. Perhitungan nilai p hanya bergantung pada kebenaran hipotesis nol. Nilai p tidak mengukur jumlah bukti yang mendukung HA; itu adalah ukuran bukti induktif terhadap H0. " 'Sumber: ftp.stat.duke.edu/WorkingPapers/03-26.pdf

sree22

@ sree22 dapatkah Anda memperluas ini, atau menyarankan penulisan ulang? Saya mencoba memberikan definisi nilai-p dalam konteks ini, bukan interpretasi.

DavidR

'Siswa' berpendapat untuk interval kepercayaan dengan alasan bahwa mereka dapat menunjukkan efek mana yang lebih penting dan juga yang lebih penting.

Misalnya, jika Anda menemukan dua efek di mana yang pertama memiliki interval kepercayaan untuk dampak keuangannya dari £ 5 hingga £ 6, sedangkan yang kedua memiliki interval kepercayaan dari £ 200 hingga £ 2800. Yang pertama lebih signifikan secara statistik tetapi yang kedua mungkin lebih penting.

Henry
sumber