Laporan berita mengatakan bahwa CERN akan mengumumkan besok bahwa boson Higgs telah secara eksperimental terdeteksi dengan 5 bukti. Menurut artikel itu:
5 setara dengan 99.99994% peluang bahwa data yang dilihat oleh detektor CMS dan ATLAS bukan hanya derau acak - dan peluang 0,00006% bahwa mereka telah ditipu; 5 adalah kepastian yang diperlukan untuk sesuatu yang secara resmi diberi label "penemuan" ilmiah.
Ini tidak super ketat, tetapi tampaknya mengatakan bahwa fisikawan menggunakan metodologi statistik "pengujian hipotesis" standar, pengaturan menjadi , yang sesuai dengan (dua sisi)? Atau adakah arti lain?
Dalam banyak ilmu pengetahuan, tentu saja, pengaturan alpha ke 0,05 dilakukan secara rutin. Ini akan setara dengan bukti "dua ", meskipun saya belum pernah mendengarnya disebut demikian. Apakah ada bidang lain (selain fisika partikel) di mana definisi alfa yang jauh lebih ketat adalah standar? Adakah yang tahu referensi tentang bagaimana aturan lima diterima oleh fisika partikel?
Pembaruan: Saya mengajukan pertanyaan ini karena alasan sederhana. Buku saya Intuitif Biostatistik (seperti kebanyakan buku statistik) memiliki bagian yang menjelaskan bagaimana sewenang-wenang aturan "P <0,05" yang biasa. Saya ingin menambahkan contoh bidang ilmiah ini di mana nilai jauh lebih kecil dianggap perlu. Tetapi jika contohnya sebenarnya lebih rumit, dengan menggunakan metode Bayesian (seperti beberapa komentar di bawah ini sarankan), maka itu tidak akan terlalu tepat atau akan membutuhkan banyak penjelasan lebih lanjut.
sumber
Jawaban:
Di sebagian besar aplikasi statistik ada yang berangan tua tentang 'semua model salah, ada yang berguna'. Karena itu, kami hanya akan mengharapkan model untuk tampil pada tingkat tertentu karena kami menggambarkan beberapa proses yang sangat rumit menggunakan beberapa model sederhana.
Fisika sangat berbeda, jadi intuisi yang dikembangkan dari model statistik tidak begitu tepat. Dalam Fisika, khususnya fisika partikel yang berhubungan langsung dengan hukum-hukum fisika fundamental, model tersebut seharusnya merupakan deskripsi yang tepat dari kenyataan. Setiap penyimpangan dari apa yang diprediksi oleh model harus sepenuhnya dijelaskan oleh kebisingan eksperimental, bukan batasan dari model. Ini berarti bahwa jika modelnya baik dan benar dan peralatan eksperimental memahami signifikansi statistik harus sangat tinggi, maka bilah tinggi yang ditetapkan.
Alasan lainnya adalah historis, komunitas fisika partikel telah dibakar di masa lalu oleh 'penemuan' pada tingkat signifikansi yang lebih rendah yang kemudian ditarik, oleh karena itu mereka umumnya lebih berhati-hati sekarang.
sumber
Sejarah dan asal
Menurut Robert D Cousins 1 dan Tommaso Dorigo 2 , asal usul ambang 5 σ terletak pada pekerjaan fisika partikel awal tahun 60-an ketika banyak histogram percobaan hamburan diselidiki dan dicari puncak / benjolan yang mungkin mengindikasikan beberapa partikel yang baru ditemukan. . Ambang adalah aturan kasar untuk menjelaskan beberapa perbandingan yang sedang dibuat.1 2 5σ
Kedua penulis merujuk pada artikel tahun 1968 dari Rosenfeld 3 , yang membahas pertanyaan apakah ada meson dan baryon yang jauh atau tidak, dimana beberapa 4 σ3 4σ efek diukur. Artikel itu menjawab pertanyaan negatif dengan menyatakan bahwa jumlah klaim yang diterbitkan sesuai dengan jumlah fluktuasi yang diperkirakan secara statistik. Seiring dengan beberapa perhitungan yang mendukung argumen ini, artikel ini mempromosikan penggunaan level 5σ :
dan kemudian di koran (penekanan adalah milikku)
Tommaso tampaknya berhati-hati dalam menyatakan bahwa itu dimulai dengan artikel Rosenfeld
Tetapi pada tahun 80-an penggunaan5 σ tersebar. Misalnya, astronom Steve Schneider 4 menyebutkan pada 1989 bahwa itu adalah sesuatu yang diajarkan (tekankan saya dalam kutipan di bawah):4
Penggunaan modern
Bidang Lainnya
Sangat menarik untuk dicatat bahwa banyak bidang ilmiah lainnya tidak memiliki ambang yang sama atau tidak, entah bagaimana, menangani masalah ini. Saya membayangkan ini masuk akal dalam kasus percobaan dengan manusia di mana sangat mahal (atau tidak mungkin) untuk memperluas percobaan yang memberikan signifikansi 0,05 atau 0,01.
Cousins, RD (2017). Paradoks Jeffreys-Lindley dan kriteria penemuan dalam fisika energi tinggi. Synthese, 194 (2), 395-432. tautan arxiv
Dorigo, T. (2013) Demystifying The Five-Sigma Criterion, dari science20.com 2019-03-07
Rosenfeld, AH (1968). Apakah ada meson atau baryon yang jauh? web-source: escholarship
Burbidge, G., Roberts, M., Schneider, S., Sharp, N., & Tifft, W. (1990, November). Diskusi panel: Masalah terkait pergeseran merah. Dalam Publikasi Konferensi NASA (Vol. 3098, hlm. 462). tautan ke fotokopi di harvard.edu
Franklin, A. (2013). Pergeseran standar: Eksperimen dalam fisika partikel di abad kedua puluh. University of Pittsburgh Press.
Apa arti dari 5 sigma? dari physics.org 2019-03-07
Beringer, J., Arguin, JF, Barnett, RM, Copic, K., Dahl, O., Groom, DE, ... & Yao, WM (2012). Ulasan fisika partikel. Tinjauan Fisik Partikel-D, Bidang, Gravitasi dan Kosmologi, 86 (1), 010001. (bagian 36.2.2. Uji signifikansi, halaman 394, tautan aps.org )
Lyons, L. (2013). Menemukan Signifikansi 5 sigma. arXiv preprint arXiv: 1310.1284. tautan arxiv
Lyons, L. (2014). Masalah Statistik dalam Pencarian Fisika Baru. arXiv pracetak tautan arxiv
Baker, M. (2015). Lebih dari setengah studi psikologi gagal dalam tes reproduktifitas. Berita Alam. dari nature.com 2019-03-07
Horton, R. (2015). Offline: apa itu 5 sigma obat? The Lancet, 385 (9976), 1380. dari thelancet.com 2019-03-07
sumber
Untuk alasan yang sama sekali berbeda dari fisika, ada bidang lain dengan alfa yang jauh lebih ketat ketika mereka melakukan pengujian hipotesis. Epidemiologi Genetik ada di antara mereka, terutama ketika mereka menggunakan "GWAS" (Genome-Wide Association Study) untuk melihat berbagai penanda genetik untuk penyakit.
Karena studi GWAS adalah latihan besar - besaran dalam pengujian hipotesis berganda, teknik-teknik analisis mutakhir semuanya dibangun di sekitar alfa yang jauh lebih ketat daripada 0,05. Teknik studi "kandidat skrining" lainnya yang mengikuti studi genomik kemungkinan akan melakukan hal yang sama.
sumber
Levelnya sangat tinggi untuk menghindari pengumuman berita prematur yang kemudian ternyata palsu. Untuk diskusi lebih lanjut tentang ini, lihat
https://physics.stackexchange.com/questions/8752/standard-deviation-in-particle-physics?rq=1
https://physics.stackexchange.com/questions/31126/how-many-sigma-did-the-discovery-of-the-w-boson-have
sumber