Mengapa terus mengajar dan menggunakan pengujian hipotesis (dengan semua konsepnya yang sulit dan yang merupakan dosa yang paling statistik) untuk masalah di mana ada penaksir interval (kepercayaan, sepatu boot, kredibilitas atau apa pun)? Apa penjelasan terbaik (jika ada) untuk diberikan kepada siswa? Hanya tradisi? Pandangan akan sangat disambut.
hypothesis-testing
confidence-interval
teaching
Washington S. Silva
sumber
sumber
Jawaban:
Ini adalah pendapat pribadi saya, jadi saya tidak yakin itu memenuhi syarat sebagai jawaban.
Mengapa kita harus mengajarkan pengujian hipotesis?
Singkatnya, satu alasan yang sangat besar adalah bahwa, dalam semua kemungkinan, dalam waktu yang Anda perlukan untuk membaca kalimat ini, ratusan, jika tidak ribuan (atau jutaan) tes hipotesis telah dilakukan dalam radius 10 kaki dari tempat Anda duduk.
Ponsel Anda pasti menggunakan tes rasio kemungkinan untuk memutuskan apakah berada dalam jangkauan stasiun pangkalan atau tidak. Perangkat keras WiFi laptop Anda juga melakukan hal yang sama dalam berkomunikasi dengan router Anda.
Microwave yang Anda gunakan untuk memanaskan kembali secara otomatis pizza yang sudah berumur dua hari itu menggunakan tes hipotesis untuk memutuskan kapan pizza Anda cukup panas.
Sistem kontrol traksi mobil Anda menendang ketika Anda memberinya terlalu banyak gas di jalan yang dingin, atau sistem peringatan tekanan ban memberi tahu Anda bahwa ban sisi penumpang belakang Anda sangat rendah, dan lampu mobil Anda menyala otomatis sekitar pukul 5: 19.00 saat senja tiba.
IPad Anda merender halaman ini dalam format lanskap berdasarkan pada pembacaan accelerometer (berisik).
Perusahaan kartu kredit Anda mematikan kartu Anda ketika "Anda" membeli TV layar datar di Best Buy di Texas dan cincin berlian $ 2000 di Zales di sebuah mal di negara bagian Washington dalam beberapa jam setelah membeli makan siang, gas, dan film dekat rumah Anda di pinggiran Pittsburgh.
Ratusan ribu bit yang dikirim untuk merender halaman web ini di browser Anda masing - masing secara individual menjalani tes hipotesis untuk menentukan apakah mereka kemungkinan besar adalah 0 atau 1 (di samping beberapa koreksi kesalahan yang luar biasa).
Lihatlah ke kanan sedikit pada topik "terkait" itu.
Semua hal ini "terjadi" karena tes hipotesis . Untuk banyak hal ini, beberapa perkiraan interval beberapa parameter dapat dihitung. Tetapi, terutama untuk proses industri otomatis, penggunaan dan pemahaman pengujian hipotesis sangat penting.
Pada tingkat statistik yang lebih teoretis, konsep penting kekuatan statistik muncul secara alami dari kerangka kerja pengambilan keputusan-teori / hipotesis. Selain itu, saya percaya "bahkan" seorang ahli matematika murni dapat menghargai keindahan dan kesederhanaan lemma Neyman-Pearson dan buktinya.
Ini bukan untuk mengatakan bahwa pengujian hipotesis diajarkan, atau dipahami, dengan baik. Pada umumnya, ini bukan. Dan, sementara saya akan setuju bahwa — khususnya dalam ilmu kedokteran — pelaporan perkiraan interval beserta ukuran efek dan pengertian praktis vs statistik hampir secara universal lebih disukai daripada uji hipotesis formal, ini tidak berarti bahwa pengujian hipotesis dan yang terkait konsep tidak penting dan tidak menarik dalam dirinya sendiri.
sumber
Saya mengajar tes hipotesis karena sejumlah alasan. Salah satunya adalah historis, bahwa mereka harus memahami sebagian besar penelitian sebelumnya yang mereka baca dan memahami sudut pandang pengujian hipotesis. Yang kedua adalah bahwa, bahkan di zaman modern, itu masih digunakan oleh beberapa peneliti, sering secara implisit, ketika melakukan jenis analisis statistik lainnya.
Tetapi ketika saya mengajarkannya, saya mengajarkannya dalam kerangka membangun model, bahwa asumsi dan perkiraan ini adalah bagian dari model pembangunan. Dengan begitu, relatif mudah untuk beralih untuk membandingkan model yang lebih kompleks dan menarik secara teoritis. Penelitian lebih sering mengadu teori satu sama lain daripada teori versus tidak sama sekali.
Dosa pengujian hipotesis tidak melekat dalam matematika, dan penggunaan yang tepat dari perhitungan tersebut. Di mana mereka terutama berbohong adalah sangat mengandalkan dan salah tafsir. Jika sebagian besar peneliti naif secara eksklusif menggunakan estimasi interval tanpa pengakuan hubungan apa pun dengan hal-hal ini kita sebut hipotesis, kita mungkin menyebutnya dosa.
sumber
Saya pribadi merasa kita akan lebih baik tanpa tes hipotesis. Satu-satunya tempat yang bisa saya pikirkan di mana tes hipotesis menawarkan sesuatu yang unik dan berguna adalah di bidang beberapa tingkat tes hipotesis gabungan kebebasan. Contohnya termasuk ANOVA untuk membandingkan lebih dari dua kelompok, tes simultan yang menggabungkan efek utama dan interaksi (tes efek total), dan tes simultan yang menggabungkan istilah linier dan nonlinear yang terkait dengan prediktor kontinu (uji hubungan berganda df). Untuk hal-hal sederhana, estimasi interval lebih mudah, dan jauh lebih kecil kemungkinannya untuk menyesatkan daripada nilai- . Seperti yang dikatakan dengan baik di kertas klasik Absennya bukti bukanlah bukti ketidakhadiran , nilai- besar tidak mengandung informasi. P P PP P P -nilai hanya memberikan bukti terhadap hipotesis, tidak pernah mendukungnya (tanggapan Fisher ketika ditanya bagaimana menafsirkan nilai- besar adalah "Dapatkan lebih banyak data"). Interval kepercayaan atau kredibilitas membuat peneliti lebih jujur dengan menggambarkan seberapa banyak dia tidak tahu.P
sumber
Saya pikir itu tergantung pada yang pengujian hipotesis Anda berbicara tentang. Pengujian hipotesis "klasik" (Neyman-Pearson) dikatakan rusak karena tidak sesuai dengan apa yang sebenarnya terjadi ketika Anda melakukan tes . Alih-alih dirancang untuk bekerja "terlepas dari" apa yang sebenarnya Anda lihat dalam jangka panjang. Tetapi kegagalan untuk kondisi dapat menyebabkan hasil yang menyesatkan dalam kasus individu. Ini hanya karena prosedur "tidak peduli" tentang kasus individu, dalam jangka panjang.
Pengujian hipotesis dapat dilakukan dalam kerangka teori keputusan, yang menurut saya merupakan cara yang jauh lebih baik untuk memahaminya. Anda dapat menyatakan kembali masalahnya sebagai dua keputusan:
Kerangka keputusan lebih mudah dipahami, karena dengan jelas memisahkan konsep "apa yang akan Anda lakukan?" dan "apa kebenarannya?" (melalui informasi Anda sebelumnya).
Anda bahkan dapat menerapkan "teori keputusan" (DT) untuk pertanyaan Anda. Tetapi untuk menghentikan pengujian hipotesis, DT mengatakan Anda harus memiliki keputusan alternatif yang tersedia untuk Anda. Jadi pertanyaannya adalah: jika pengujian hipotesis ditinggalkan, apa yang akan terjadi? Saya tidak bisa memikirkan jawaban untuk pertanyaan ini. Saya hanya bisa memikirkan cara alternatif untuk melakukan pengujian hipotesis.
(CATATAN: dalam konteks pengujian hipotesis, data, distribusi pengambilan sampel, distribusi sebelumnya, dan fungsi kehilangan semua informasi sebelumnya karena mereka diperoleh sebelum membuat keputusan.)
sumber
Jika saya seorang hardcore, saya akan mengingatkan Anda bahwa interval kepercayaan cukup teratur hanya tes hipotesis terbalik, yaitu ketika interval 95% hanyalah cara lain untuk menggambarkan semua titik bahwa tes yang melibatkan data Anda tidak akan ditolak pada 0,05 tingkat. Dalam situasi ini, preferensi untuk yang satu lebih daripada yang lain adalah masalah eksposisi daripada metode.
Sekarang, eksposisi tentu saja penting, tetapi saya pikir itu akan menjadi argumen yang cukup bagus. Sangat rapi dan mengklarifikasi untuk menjelaskan dua pendekatan sebagai penyajian kembali kesimpulan yang sama dari sudut pandang yang berbeda. (Fakta bahwa tidak semua penaksir interval adalah tes terbalik adalah fakta yang tidak tepat tetapi tidak terlalu canggung, secara pedagogis berbicara).
Implikasi yang jauh lebih serius datang dari keputusan untuk mengkondisikan pengamatan, sebagaimana ditunjukkan di atas. Namun, bahkan dalam retret, Frequentist selalu dapat mengamati bahwa ada banyak situasi (mungkin bukan mayoritas) di mana pengkondisian pada pengamatan akan menjadi tidak bijaksana atau tidak menyenangkan. Bagi mereka, pengaturan HT / CI adalah (bukan 'adalah') persis apa yang diinginkan, dan harus diajarkan seperti itu.
sumber
Dalam mengajar pengujian hipotesis Neyman Pearson kepada siswa statistik awal, saya sering mencoba menemukannya dalam pengaturan aslinya: yaitu membuat keputusan. Maka infrastruktur kesalahan tipe 1 dan tipe 2 semuanya masuk akal, seperti halnya gagasan bahwa Anda mungkin menerima hipotesis nol.
Kami harus membuat keputusan, kami berpikir bahwa hasil dari keputusan kami dapat ditingkatkan dengan pengetahuan tentang parameter, kami hanya memiliki perkiraan parameter itu. Kami masih harus membuat keputusan. Lalu apa keputusan terbaik yang harus diambil dalam konteks memiliki estimasi parameter?
Tampak bagi saya bahwa dalam pengaturan aslinya (membuat keputusan dalam menghadapi ketidakpastian) tes hipotesis NP masuk akal. Lihat misalnya N&P 1933, khususnya hlm. 291.
Neyman dan Pearson. Pada masalah tes hipotesis statistik yang paling efisien. Transaksi filosofis dari Royal Society of London. Seri A, Berisi Makalah dari Karakter Matematika atau Fisik (1933) vol. 231 hal. 289-337
sumber
Pengujian hipotesis adalah cara yang berguna untuk membingkai banyak pertanyaan: apakah efek dari pengobatan nol atau tidak nol? Kemampuan antara pernyataan seperti ini dan model atau prosedur statistik (termasuk pembangunan estimator interval) penting bagi praktisi saya pikir.
Juga disebutkan bahwa interval kepercayaan (dalam pengertian tradisional) secara inheren tidak lebih "rawan dosa" daripada pengujian hipotesis - berapa banyak statistik intro yang diketahui siswa tentang definisi sebenarnya dari interval kepercayaan?
Mungkin masalahnya bukan pengujian hipotesis atau estimasi interval karena ini adalah versi klasik yang sama; formulasi Bayesian menghindarinya dengan cukup baik.
sumber
Alasannya adalah pengambilan keputusan. Dalam kebanyakan pengambilan keputusan, Anda melakukannya atau tidak. Anda dapat terus mencari pada interval sepanjang hari, pada akhirnya ada saat di mana Anda memutuskan untuk melakukannya atau tidak.
Pengujian hipotesis cocok dengan kenyataan sederhana ini YA / TIDAK.
sumber