Saya sangat tidak setuju dengan lompatan @fcoppens dari mengakui pentingnya koreksi multi-hipotesis dalam satu penyelidikan untuk mengklaim bahwa "Dengan alasan yang sama, hal yang sama berlaku jika beberapa tim melakukan tes ini."
Tidak ada pertanyaan bahwa semakin banyak penelitian dilakukan dan semakin banyak hipotesis diuji, semakin banyak kesalahan Tipe I akan terjadi. Tapi saya pikir ada kebingungan di sini tentang arti dari tingkat "kesalahan karena keluarga" dan bagaimana mereka berlaku dalam karya ilmiah yang sebenarnya.
Pertama, ingatlah bahwa beberapa pengujian pengujian biasanya muncul dalam perbandingan post-hoc yang tidak ada hipotesis pra-formulasi. Sama sekali tidak jelas bahwa koreksi yang sama diperlukan ketika ada seperangkat hipotesis yang telah ditentukan sebelumnya.
Kedua, "kebenaran ilmiah" dari sebuah publikasi individual tidak bergantung pada kebenaran dari setiap pernyataan individu dalam publikasi tersebut. Sebuah studi yang dirancang dengan baik mendekati hipotesis ilmiah secara keseluruhan (yang bertentangan dengan statistik) dari berbagai perspektif, dan menyatukan berbagai jenis hasil untuk mengevaluasi hipotesis ilmiah . Setiap hasil individu dapat dievaluasi dengan uji statistik.
Namun dengan argumen dari @ fcoppens, jika bahkan salah satu dari uji statistik individu tersebut membuat kesalahan Tipe I maka itu mengarah pada "kepercayaan salah 'kebenaran ilmiah'". Ini salah.
"Kebenaran ilmiah" dari hipotesis ilmiah dalam publikasi, yang bertentangan dengan validitas uji statistik individu, umumnya berasal dari kombinasi berbagai jenis bukti. Desakan pada berbagai jenis bukti membuat validitas hipotesis ilmiah kuat untuk kesalahan individu yang tak terelakkan terjadi. Ketika saya melihat kembali pada 50 atau lebih publikasi ilmiah saya, saya akan sulit sekali menemukan ada yang tetap begitu sempurna dalam setiap detail seperti yang tampaknya ditekankan oleh @ fcoppens. Namun saya juga sulit sekali menemukan di mana pun ilmiahhipotesis itu salah besar. Tidak lengkap, mungkin; dibuat tidak relevan dengan perkembangan selanjutnya di lapangan, tentu saja. Namun tidak "salah" dalam konteks keadaan pengetahuan ilmiah saat itu.
Ketiga, argumen mengabaikan biaya membuat kesalahan Tipe II. Kesalahan tipe II mungkin menutup seluruh bidang penyelidikan ilmiah yang menjanjikan. Jika rekomendasi @fcoppens harus diikuti, tingkat kesalahan Tipe II akan meningkat secara besar-besaran, sehingga merugikan perusahaan ilmiah.
Akhirnya, rekomendasi tidak mungkin untuk diikuti dalam praktik. Jika saya menganalisis satu set data yang tersedia untuk umum, saya mungkin tidak memiliki cara untuk mengetahui apakah orang lain telah menggunakannya, atau untuk tujuan apa. Saya tidak memiliki cara untuk mengoreksi tes hipotesis orang lain. Dan seperti yang saya katakan di atas, saya seharusnya tidak perlu.
Dalam pengujian hipotesis statistik seseorang hanya dapat menemukan bukti statistik untuk hipotesis alternatif dengan menolak nol, menolak nol memungkinkan kita untuk menyimpulkan bahwa ada bukti yang mendukung hipotesis alternatif. (lihat juga Apa yang terjadi jika kita gagal menolak hipotesis nol? ).
Jadi penolakan yang salah terhadap yang nol memberi kita bukti yang salah sehingga keyakinan yang salah tentang '' kebenaran ilmiah ''. Inilah sebabnya mengapa inflasi tipe I ini (hampir dua kali lipat dari kesalahan tipe I) harus dihindari; kesalahan tipe I yang lebih tinggi menyiratkan keyakinan yang lebih keliru bahwa sesuatu terbukti secara ilmiah . Oleh karena itu orang '' mengontrol '' tipe Ierror pada tingkat keluarga.
Dengan alasan yang sama, hal yang sama berlaku jika beberapa tim melakukan tes ini (pada data yang sama).
Jelas, temuan di atas hanya berlaku jika kita tim bekerja pada data yang sama . Apa bedanya ketika mereka mengerjakan sampel yang berbeda?
Jadi jika kita menggunakan data yang sama, bisa jadi kesimpulan dari tes didasarkan pada sampel yang diambil dengan '' peluang buruk ''. Dengan sampel lain konteksnya berbeda.
sumber