Pada bulan Februari 2016, American Statistics Association merilis pernyataan resmi tentang signifikansi statistik dan nilai-p. Utas kami tentang ini membahas masalah ini secara luas. Namun, tidak ada otoritas yang muncul untuk menawarkan alternatif efektif yang diakui secara universal - sampai sekarang. American Statistical Society (ASS) telah menerbitkan tanggapannya, nilai-p: Apa selanjutnya?
"Nilai-p tidak baik untuk banyak hal."
Kami pikir ASA tidak cukup jauh. Sudah saatnya untuk mengakui bahwa era nilai-p telah berakhir. Para ahli statistik telah berhasil menggunakannya untuk membingungkan sarjana, mengelabui para ilmuwan, dan menipu para editor di mana-mana, tetapi dunia mulai melihat melalui tipu muslihat ini. Kita harus meninggalkan upaya awal abad ke-20 ini oleh ahli statistik untuk mengendalikan pengambilan keputusan. Kita perlu kembali ke apa yang sebenarnya berhasil.
Proposal ASS resmi adalah ini:
Di tempat nilai-p, ASS menganjurkan STOP (prosedur SeaT-Of-Pants). Metode waktu-dihormati dan diuji ini digunakan oleh orang-orang Yunani kuno, orang-orang renaisans, dan semua ilmuwan sampai Ronald Fisher datang dan menghancurkan hal-hal. STOP sederhana, langsung, berbasis data, dan otoritatif. Untuk melaksanakannya, seorang tokoh otoritas (pria yang lebih tua, berdasarkan preferensi) meninjau data dan memutuskan apakah mereka setuju dengan pendapatnya. Ketika dia memutuskan mereka melakukannya, hasilnya “signifikan.” Jika tidak, maka semua orang diharuskan untuk melupakan semuanya.
Prinsip
Respons tersebut membahas masing-masing dari enam prinsip ASA.
STOP dapat menunjukkan seberapa tidak kompatibelnya data dengan model statistik yang ditentukan.
Kami menyukai ungkapan ini karena ini adalah cara yang suka mengatakan STOP akan menjawab pertanyaan ya atau tidak. Tidak seperti nilai-p atau prosedur statistik lainnya, tidak ada keraguan. Ini adalah tanggapan sempurna bagi mereka yang mengatakan, “kita tidak perlu hipotesis nol! Apa *?! @ Apa itu? Tidak ada yang pernah tahu apa yang seharusnya. "
STOP tidak mengukur probabilitas bahwa hipotesis itu benar: itu benar-benar memutuskan apakah itu benar atau tidak.
Semua orang bingung oleh probabilitas. Dengan mengambil probabilitas dari gambar, STOP menghilangkan kebutuhan untuk studi sarjana dan pascasarjana selama bertahun-tahun. Sekarang siapa pun (yang sudah cukup tua dan laki-laki) dapat melakukan analisis statistik tanpa rasa sakit dan siksaan mendengarkan bahkan satu ceramah statistik tunggal atau menjalankan perangkat lunak misterius yang memuntahkan hasil yang tidak dapat dipahami.
Kesimpulan ilmiah dan keputusan bisnis atau kebijakan dapat didasarkan pada akal sehat dan figur otoritas nyata.
Lagipula, keputusan penting selalu dibuat oleh otoritas, jadi mari kita akui saja dan hentikan perantara. Menggunakan STOP akan membebaskan ahli statistik untuk melakukan apa yang paling cocok untuk mereka: menggunakan angka untuk mengaburkan kebenaran dan menguduskan preferensi mereka yang berkuasa.
Inferensi yang tepat membutuhkan pelaporan dan transparansi penuh.
STOP adalah prosedur statistik paling transparan dan jelas yang pernah ditemukan: Anda melihat data dan memutuskan. Ini menghilangkan semua tes-z yang membingungkan, uji-t, tes chi-squared, dan prosedur sup alfabet (ANOVA! GLM! MLE!) Yang digunakan oleh orang-orang untuk menyembunyikan fakta bahwa mereka tidak tahu apa artinya data.
STOP mengukur pentingnya hasil.
Ini terbukti dengan sendirinya: jika seseorang yang berwenang menggunakan STOP, maka hasilnya haruslah penting.
Dengan sendirinya, STOP memberikan ukuran bukti yang baik mengenai model atau hipotesis.
Kami tidak ingin menantang otoritas, bukan? Peneliti dan pembuat keputusan akan mengakui bahwa STOP menyediakan semua informasi yang perlu mereka ketahui. Untuk alasan ini, analisis data dapat diakhiri dengan STOP; tidak perlu pendekatan alternatif, seperti nilai-p, pembelajaran mesin, atau astrologi.
Pendekatan lain
Beberapa ahli statistik lebih suka apa yang disebut metode "Bayesian", di mana teorema yang tidak jelas yang diterbitkan secara anumerta oleh seorang ulama abad ke-18 diterapkan tanpa berpikir untuk menyelesaikan setiap masalah. Para advokat yang paling terkenal dengan bebas mengakui metode ini adalah "subyektif." Jika kita akan menggunakan metode subyektif, maka jelas semakin otoritatif dan berpengetahuan pengambil keputusan, semakin baik hasilnya. STOP dengan demikian muncul sebagai batas logis dari semua metode Bayes. Mengapa pergi ke upaya mengerjakan perhitungan mengerikan itu, dan mengikat begitu banyak waktu komputer, ketika Anda bisa menunjukkan data kepada orang yang bertanggung jawab dan bertanya kepadanya apa pendapatnya? Akhir dari cerita.
Komunitas lain baru-baru ini muncul untuk menantang imamat para ahli statistik. Mereka menyebut diri mereka "pelajar mesin" dan "ilmuwan data," tetapi mereka sebenarnya hanya peretas yang mencari status lebih tinggi. Ini adalah posisi resmi ASS bahwa orang-orang ini harus membentuk organisasi profesional mereka sendiri jika mereka ingin orang menganggapnya serius.
Pertanyaan
Apakah ini jawaban untuk masalah yang diidentifikasi ASA dengan nilai-p dan pengujian hipotesis nol? Bisakah itu benar-benar menyatukan paradigma Bayesian dan Frequentist (seperti yang secara implisit diklaim dalam respons)?
Jawaban:
Saya telah advokasi untuk pendekatan baru saya sendiri untuk pengambilan keputusan statistik yang disebut Radd: R oll A D amn D yaitu. Ini juga membahas semua poin utama.
1) RADD dapat menunjukkan seberapa kompatibel data dengan model statistik yang ditentukan.
2) RADD dapat memutuskan apakah hipotesis itu benar atau tidak.
3) RADD dapat digunakan untuk membuat keputusan bisnis atau kebijakan
4) RADD transparan.
5) RADD mengukur pentingnya hasil.
6) RADD memberikan ukuran bukti yang baik.
Jadi, tidak, BERHENTI bukanlah jawabannya. Jawabannya adalah RADD.
sumber
sumber
Ini baik-baik saja tambahan untuk debat nilai-p, menarik tetapi juga agak basi menurut saya, mengingatkan saya pada makalah unik yang diterbitkan beberapa tahun lalu dalam edisi Natal dari British Medical Journal (BMJ), yang setiap Natal menerbitkan penelitian nyata namun lucu artikel. Secara khusus, karya Isaacs dan Fitzgerald ini menyoroti tujuh alternatif utama untuk kedokteran berbasis bukti (yaitu praktik kedokteran berdasarkan bukti klinis dan statistik aktual):
Yang paling menarik, Anda harus melihat kolom yang menyorot alat pengukur dan satuan pengukuran untuk item di atas (mis. Audiometer dan desibel untuk obat berbasis semangat!).
sumber