Mengapa kesalahan tipe II tidak banyak ditekankan dalam literatur statistik?

10

Saya telah melihat banyak kasus di mana kesalahan tipe I diperhitungkan (dilambangkan dengan nilai alfa) di berbagai artikel penelitian. Saya jarang menemukan bahwa seorang peneliti akan mempertimbangkan kekuatan, atau kesalahan tipe II.

Kesalahan tipe II bisa menjadi masalah besar bukan? Kami secara tidak sengaja telah menolak hipotesis alternatif ketika itu sebenarnya salah. Mengapa nilai alpha lebih ditekankan daripada nilai beta?

Ketika saya mengambil statistik tahun pertama, saya tidak pernah diajari beta — hanya alpha. Saya merasa bahwa dua kesalahan ini harus diperlakukan sama. Namun, hanya alpha yang tampaknya ditekankan.


sumber
1
+1 Alasannya adalah bahwa secara tradisional, kesalahan Tipe I (alias, atau tingkat signifikansi ) diperbaiki terlebih dahulu, dan kemudian tes dibangun seperti untuk meminimalkan kesalahan Tipe II (setara, seperti untuk memaksimalkan daya) . Artikel bermanfaat tentang wikipedia untuk memahami masalah ini adalah artikel tentang pengujian Uniformly Most Powerful (UMP), en.wikipedia.org/wiki/Uniformly_most_powerful_testα
Jeremias K
3
Anda salah tentang "kami telah menerima hipotesis nol" - kami tidak pernah menerimanya. Kami "menolak null hyp", atau "gagal menolak null hyp", tetapi tidak pernah menerima null hyp!
manusia gua
jahanam - yang meluncur melewati saya. Terima kasih telah menunjukkannya.
1
Berhati-hatilah untuk tidak membingungkan pengalaman Anda sendiri dengan seluruh bidang literatur statistik; Anda sulit menyimpulkan materi yang belum Anda baca.
Glen_b -Reinstate Monica
@glen langsung. Judul yang cerdas mendapat lebih banyak tanggapan.

Jawaban:

5

Ini pertanyaan yang bagus. Mari saya mulai dengan beberapa klarifikasi:


Saya pikir Anda (sayangnya) benar bahwa kurang perhatian diberikan untuk kesalahan kekuasaan dan tipe II. Sementara saya pikir situasinya membaik dalam penelitian biomedis (misalnya, lembaga pendanaan dan IRB sering memerlukan analisis daya sekarang), saya pikir ada beberapa alasan untuk ini:

  1. Saya pikir kekuatan lebih sulit untuk dipahami orang daripada signifikansi sederhana. (Ini sebagian karena itu tergantung pada banyak yang tidak diketahui - terutama ukuran efek, tetapi ada yang lain juga).
  2. Sebagian besar ilmu (yaitu, selain fisika dan kimia) tidak secara matematis. Akibatnya, sangat sulit bagi para peneliti untuk mengetahui apa ukuran efek 'harus' diberikan teori mereka (selain hanya ). 0
  3. Para ilmuwan secara tradisional berasumsi bahwa kesalahan tipe I lebih buruk daripada kesalahan tipe II.
gung - Pasang kembali Monica
sumber
1
Seperti biasa, mencerahkan - terutama untuk yang non-matematis :-) ... Saya suka kata-kata ini ... Saya ingin tahu apakah Anda dapat memperluas sedikit pada poin ketiga ... Apakah ada dasar untuk bias ini. Saya tahu itu benar, tetapi mengapa menurut Anda ini masalahnya ... Apakah karena ini tentang piala nilai-p, dan tidak ada yang lain yang penting?
Antoni Parellada
Terima kasih, @AntoniParellada. Saya akan memikirkan apa lagi yang bisa saya tambahkan.
gung - Reinstate Monica
2
Saya akan menjelaskan poin 3) mengapa para ilmuwan berpikir kesalahan tipe I lebih buruk. Hipotesis nol biasanya semacam "status quo", misalnya efek obat baru ini adalah 0. Kami menyukai status quo, dan beban pembuktian ada pada peneliti untuk membuktikan sebaliknya. Jadi, kami ingin membatasi kesalahan Tipe I, yaitu kami salah menolak status quo. IMO, keterikatan pada status quo ini hanya filosofis. Jika Anda ingin mengubah pendapat saya, Anda harus membuktikannya.
Heisenberg
1
Dalam praktiknya, orang dapat dengan mudah memikirkan kasus-kasus di mana kesalahan tipe II lebih penting, yaitu biaya untuk tidak menolak nol tinggi. Misalnya, jika manusia menghadapi epidemi zombie, saya yakin sikapnya akan "coba obat apa pun walaupun itu mungkin tidak berhasil" daripada "Anda harus membuktikan bahwa itu berhasil sebelum kita menggunakannya".
Heisenberg
Menambahkan ke @ Heisenberg: Dalam kasus di mana kesalahan tipe II paling penting, orang harus mempertimbangkan beralih antara tes hipotesis titik dan uji ekivalensi. Dalam contoh Anda, seseorang harus membuktikan bahwa saus worcester yang diusulkan setidaknya tidak memperburuk epidemi zombie. Kemudian tingkat kesalahan mengubah peran mereka dan tingkat kesalahan yang paling penting diperbaiki oleh desain lagi. Juga, jika Anda memiliki beberapa perkiraan biaya keputusan yang salah, seseorang harus mempertimbangkan aturan keputusan yang meminimalkan risiko dan tidak (tentu) memperbaiki tingkat kesalahan tipe I tertentu.
Horst Grünbusch
2

Alasannya adalah kita tidak tahu tingkat kesalahan tipe II yang sebenarnya dan kita tidak akan pernah. Itu tergantung pada parameter yang biasanya tidak kita ketahui. Pada gilirannya, jika kita mengetahui parameter ini, kita tidak perlu melakukan uji statistik.

Namun, kami dapat merencanakan eksperimen sedemikian rupa sehingga tingkat kesalahan tipe II tertentu terpenuhi mengingat beberapa alternatif benar. Dengan cara ini, kami akan memilih ukuran sampel yang tidak menyia-nyiakan sumber daya: Entah karena tes pada akhirnya tidak menolak atau karena ukuran sampel yang jauh lebih kecil sudah cukup untuk menolak hipotesis.

Horst Grünbusch
sumber