Konsep 'terbukti secara statistik'

10

Ketika berita berbicara tentang hal-hal yang 'terbukti secara statistik' apakah mereka menggunakan konsep statistik yang terdefinisi dengan benar, menggunakannya salah, atau hanya menggunakan oxymoron?

Saya membayangkan bahwa 'bukti statistik' sebenarnya bukan sesuatu yang dilakukan untuk membuktikan hipotesis, atau bukti matematika, tetapi lebih dari 'uji statistik'.

Feora Quora
sumber
10
Tidak ada bukti dalam statistik kecuali bahwa bukti dalam statistik matematika harus mengikuti standar matematika. Namun, bukti semacam itu tidak relevan dengan pertanyaan Anda. Dalam hal contoh Anda, tidak seorang pun kecuali orang idiot atau pelucu mengklaim bahwa setiap keluarga Amerika memiliki 2,4 anak. Paling-paling, klaimnya adalah bahwa, rata-rata, keluarga memiliki 2,4 anak; yang dapat diperiksa dengan survei sampel atau sensus lain, tetapi karena jumlahnya dapat berfluktuasi atau berubah secara sistematis, hasil yang berbeda tidak berarti hasil pertama tidak benar; tidak juga hasil yang sama berarti hasil pertama benar.
Nick Cox

Jawaban:

16

Apa yang dibicarakan orang adalah dugaan siapa pun dan berbeda dengan siaran berita. Mungkin yang paling umum adalah mereka memberikan ringkasan penelitian yang membutuhkan beberapa halaman.

Namun, paragraf terakhir Anda salah. Secara statistik, setiap keluarga TIDAK memiliki 2,4 anak. Rata - rata adalah 2,4 anak-anak. Ini sepenuhnya mungkin. Jika Anda mengambil sampel acak dari keluarga Amerika (sulit untuk dilakukan, tetapi mungkin) maka Anda akan mendapatkan estimasi rata-rata. Namun, jika Anda mengambil sensus keluarga, maka, jika sensus itu benar-benar membuat setiap keluarga (tidak) atau, jika orang yang didapatnya mewakili orang yang tidak mendapatkannya, sehubungan dengan jumlah anak, maka Anda akan membuktikan fakta.

Namun, tidak hanya sensus yang merindukan orang, orang-orang yang dilewatinya juga berbeda dalam banyak hal dengan orang yang mendapatkannya. Karena itu, Biro Sensus mencoba mencari tahu bagaimana mereka berbeda; dengan demikian, sekali lagi, memberikan perkiraan jumlah anak per keluarga.

Tetapi ada beberapa hal yang dapat Anda buktikan; jika Anda ingin tahu, katakanlah, jumlah rata-rata tahun yang diajarkan setiap profesor di departemen Anda, Anda bisa mendapatkan data yang akurat dan menghasilkan mean yang tepat.

Paragraf kedua dari belakang Anda juga bermasalah karena tes statistik dilakukan tepat untuk membuktikan hipotesis; lebih tepatnya, mereka dilakukan (dalam kerangka frequentist, toh) untuk menolak hipotesis nol pada tingkat signifikansi tertentu.

Peter Flom - Pasang kembali Monica
sumber
Koreksi pertanyaan saya.
Quora Feans
5

Saya pikir - seperti banyak hal lainnya - ini adalah kombinasi dari kesalahpahaman budaya yang meluas dan upaya jurnalistik untuk membuat tulisan cepat yang kadang-kadang menyesatkan.

" Ponsel menyebabkan kanker! " Menjual lebih banyak iklan daripada beberapa penjelasan tentang menyelidiki kemungkinan tautan.

Tentu saja kesimpulan berdasarkan inferensi statistik bukanlah bukti dalam bentuk apa pun. Ini bergantung pada asumsi, dan bahkan kemudian kesimpulan (paling-paling) adalah probabilistik (seperti yang kita dapatkan, katakan dengan inferensi Bayesian), dan kemudian dengan inferensi frequentist Anda harus menambahkan kesalahan interpretasi yang salah dari nilai-p sebagai probabilitas bahwa null itu benar. Itu bahkan tanpa mempertimbangkan masalah seperti publikasi atau bias pelaporan

Anda melihat kesalahan yang serupa sama banyak dengan pelaporan sains secara lebih umum dan itu juga membuat frustrasi .

Saya sendiri tidak suka frasa 'terbukti secara statistik', karena saya pikir itu memberi kesan yang salah. Sementara statistik yang dilakukan dengan baik adalah alat yang ampuh, hal-hal yang sebenarnya disampaikan statistik kepada kita bisa sangat halus dan diskusi yang tepat tentang makna dari apa yang dipelajari dan kualifikasi yang menyertainya pada kesimpulan sering tidak cocok dengan hype dan punchiness dari headline atau beberapa paragraf tergesa-gesa terjepit di sela-sela gosip selebritas yang biasa.

Memang, bahkan dalam jurnal akademik di mana kualifikasi semacam itu akan tampak penting, mereka sering dikesampingkan dan malah muncul beberapa pernyataan formula (berbeda dari area penelitian ke area penelitian) yang dianggap sebagai 'urapan' hasilnya.

Saya pikir ada ruang untuk secara hati-hati menjelaskan alasan dari hasil inferensi (apakah estimasi titik dan interval, pengujian hipotesis, perhitungan teoretik keputusan atau bahkan konstruksi eksplorasi dari beberapa perbandingan visual) ke kesimpulan yang mereka tuju. Alasan itu adalah di mana inti masalah yang sebenarnya (termasuk di mana kesenjangan dalam penalaran akan dibiarkan terbuka, jika mereka eksplisit) dan kita jarang melihatnya diletakkan.

Selain itu, kita bisa terus mengeluarkan nada peringatan

Glen_b -Reinstate Monica
sumber
(+1) Bisakah Anda meninjau masing-masing dan semua makalah masa depan saya?
Matt Krause
2
Anda mungkin tidak menyukainya. Lebih dari satu kali laporan wasit saya berakhir jauh lebih lama daripada kertas aslinya, ketika saya membahas secara rinci apa yang salah dan bagaimana cara memperbaikinya (biasanya hanya memiliki respons untuk memotong seluruh bagian kertas daripada mencoba untuk memperbaiki bagian yang paling bermasalah, tetapi biasanya paling menarik, sayangnya). Salah satu siswa saya memiliki laporan yang sama rinci tentang pekerjaannya dari salah satu wasitnya; itu sebenarnya cukup berharga dan menghasilkan produk akhir yang jauh lebih baik.
Glen_b -Reinstate Monica
-2

Pengetahuan empiris selalu probabilistik - tidak pernah benar atau salah, tetapi selalu ada di antaranya. Statistik "bukti" adalah masalah mengumpulkan data yang cukup untuk mengurangi probabilitas bahwa suatu hipotesis salah sampai kurang dari beberapa ambang batas yang diterima. Dan ambang untuk "kebenaran" atau "kebenaran" berbeda dari satu disiplin akademis ke yang berikutnya. Sosiolog puas dengan probabilitas 95% untuk menjadi benar, dan kadang-kadang menerima kurang; Fisikawan kuantum menuntut 99,99999% atau lebih baik.

Kevin Krumwiede
sumber
2
Selamat datang di situs ini, @Kevin Krumwiede. Kalimat terakhir Anda tidak jelas. Sepertinya Anda membuat kesalahan umum yang mengonfigurasi nilai-p <0,05 (misalnya) dengan probabilitas 95% bahwa hipotesis nol salah.
gung - Reinstate Monica