Saya telah membaca tentang kontroversi mengenai pengujian hipotesis dengan beberapa komentator yang menyarankan bahwa pengujian hipotesis tidak boleh digunakan. Beberapa komentator menyarankan agar interval kepercayaan sebaiknya digunakan.
- Apa perbedaan antara interval kepercayaan dan pengujian hipotesis? Penjelasan dengan referensi dan contoh akan sangat dihargai.
hypothesis-testing
confidence-interval
statistik cinta
sumber
sumber
Jawaban:
Anda dapat menggunakan interval kepercayaan diri (CI) untuk pengujian hipotesis. Dalam kasus khusus, jika CI untuk efek tidak menjangkau 0 maka Anda dapat menolak hipotesis nol. Tetapi CI dapat digunakan untuk lebih, sedangkan melaporkan apakah telah lulus adalah batas kegunaan tes.
Alasan Anda disarankan untuk menggunakan CI daripada hanya uji-t, misalnya, adalah karena Anda dapat melakukan lebih dari sekadar menguji hipotesis. Anda dapat membuat pernyataan tentang rentang efek yang Anda yakini kemungkinan (yang ada di CI). Anda tidak dapat melakukan itu hanya dengan uji-t. Anda juga dapat menggunakannya untuk membuat pernyataan tentang nol, yang tidak dapat Anda lakukan dengan uji-t. Jika uji-t tidak menolak nol maka Anda hanya mengatakan bahwa Anda tidak bisa menolak nol, yang tidak banyak bicara. Tetapi jika Anda memiliki interval kepercayaan sempit di sekitar nol maka Anda dapat menyarankan bahwa nol, atau nilai yang dekat dengannya, kemungkinan adalah nilai sebenarnya dan menyarankan pengaruh perlakuan, atau variabel independen, terlalu kecil untuk bermakna ( atau bahwa percobaan Anda tidak
Ditambahkan kemudian: Saya benar-benar harus mengatakan itu, sementara Anda dapat menggunakan CI seperti tes itu bukan salah Ini merupakan perkiraan rentang tempat Anda berpikir nilai parameter berada. Anda dapat membuat tes seperti kesimpulan tetapi Anda jauh lebih baik tidak pernah membicarakannya seperti itu.
Mana yang lebih baik?
A) Efeknya adalah 0,6, t (29) = 2,8, p <0,05. Efek signifikan secara statistik ini adalah ... (beberapa diskusi terjadi tentang signifikansi statistik ini tanpa menyebutkan atau bahkan kemampuan yang kuat untuk membahas implikasi praktis dari besarnya temuan ... di bawah kerangka kerja Neyman-Pearson besarnya t dan nilai p hampir tidak berarti dan yang dapat Anda diskusikan adalah apakah efeknya ada atau tidak ada. Anda tidak pernah bisa benar-benar berbicara tentang tidak ada efek berdasarkan tes.)
atau
B) Menggunakan interval kepercayaan 95% saya memperkirakan efeknya antara 0,2 dan 1,0. (beberapa diskusi terjadi kemudian berbicara tentang efek yang sebenarnya menarik, apakah itu nilai-nilai yang masuk akal adalah orang-orang yang memiliki makna tertentu dan setiap penggunaan kata signifikan untuk persis apa yang seharusnya artinya. Selain itu, lebar CI dapat langsung menuju ke diskusi tentang apakah ini merupakan temuan yang kuat atau apakah Anda hanya dapat mencapai kesimpulan yang lebih tentatif)
Jika Anda mengambil kelas statistik dasar, Anda mungkin pada awalnya tertarik ke A. Dan mungkin ada beberapa kasus di mana itu adalah cara yang lebih baik untuk melaporkan hasilnya. Tetapi untuk sebagian besar pekerjaan B jauh lebih unggul. Perkiraan rentang bukan tes.
sumber
sumber
'Siswa' berpendapat untuk interval kepercayaan dengan alasan bahwa mereka dapat menunjukkan efek mana yang lebih penting dan juga yang lebih penting.
Misalnya, jika Anda menemukan dua efek di mana yang pertama memiliki interval kepercayaan untuk dampak keuangannya dari £ 5 hingga £ 6, sedangkan yang kedua memiliki interval kepercayaan dari £ 200 hingga £ 2800. Yang pertama lebih signifikan secara statistik tetapi yang kedua mungkin lebih penting.
sumber