Saya tidak tahu apakah ini hanya saya, tetapi saya sangat skeptis dengan statistik secara umum. Saya bisa memahaminya dalam permainan dadu, permainan poker, dll. Sangat kecil, sederhana, sebagian besar permainan berulang yang diisi sendiri baik-baik saja. Sebagai contoh, pendaratan koin di tepinya cukup kecil untuk menerima probabilitas bahwa pendaratan kepala atau ekor adalah ~ 50%.
Bermain permainan poker seharga $ 10 yang bertujuan untuk kemenangan 95% baik-baik saja. Tetapi bagaimana jika seluruh tabungan Anda + lebih banyak bergantung pada Anda memukul menang atau tidak? Bagaimana mengetahui bahwa Anda akan menang dalam 95% waktu dalam situasi itu akan membantu saya sama sekali? Nilai yang diharapkan tidak banyak membantu di sana.
Contoh lain termasuk operasi yang mengancam jiwa. Bagaimana itu membantu mengetahui bahwa itu adalah tingkat kelangsungan hidup 51% versus tingkat kelangsungan hidup 99% mengingat data yang ada? Dalam kedua kasus itu, saya pikir itu tidak penting bagi saya apa yang dikatakan dokter kepada saya, dan saya akan melakukannya. Jika data aktual adalah 75%, ia mungkin juga memberi tahu saya (kecuali etika dan hukum), bahwa ada peluang 99,99999% untuk bertahan hidup jadi saya merasa lebih baik. Dengan kata lain, data yang ada tidak masalah kecuali secara biner. Meski begitu, tidak masalah jika ada tingkat kelangsungan hidup 99,99999%, jika saya akhirnya mati karenanya.
Juga, probabilitas gempa. Tidak masalah jika gempa kuat terjadi rata-rata setiap x (di mana x> 100) tahun. Saya tidak tahu apakah gempa akan terjadi seumur hidup saya. Jadi mengapa itu bahkan informasi yang berguna?
Contoh yang kurang serius, katakanlah, 100% tempat yang pernah saya kunjungi berada di Amerika, acuh tak acuh terhadap 100% tempat yang pernah saya kunjungi di Eropa, dan benci 100% tempat yang saya miliki berkunjung ke Asia. Sekarang, itu sama sekali tidak berarti bahwa saya tidak akan menemukan tempat yang saya sukai di Asia pada perjalanan saya berikutnya atau kebencian di Eropa atau acuh tak acuh di Amerika, hanya karena sifat bahwa statistik tidak menangkap semua informasi yang saya butuhkan, dan saya mungkin tidak pernah dapat menangkap semua informasi yang saya butuhkan, bahkan jika saya telah melakukan perjalanan ke lebih dari x% dari semua benua itu. Hanya karena ada yang tidak diketahui di 1-x% dari benua yang belum pernah saya kunjungi. (Jangan ragu untuk mengganti 100% dengan persentase lainnya).
Saya mengerti bahwa tidak ada cara untuk memaksa semuanya dan bahwa Anda harus bergantung pada statistik dalam banyak situasi, tetapi bagaimana kita dapat percaya bahwa statistik sangat membantu dalam situasi satu kesempatan kami, terutama ketika statistik pada dasarnya tidak meramalkan kemungkinan untuk peristiwa-peristiwa sebelumnya?
Adakah wawasan untuk mengatasi keraguan saya terhadap statistik?
sumber
Jawaban:
Pertama saya berpikir bahwa Anda mungkin membingungkan "statistik" yang berarti kumpulan angka atau fakta lain yang menggambarkan suatu kelompok atau situasi, dan "statistik" yang berarti ilmu menggunakan data dan informasi untuk memahami dunia dalam menghadapi variasi (orang lain mungkin dapat meningkatkan definisi saya). Para ahli statistik menggunakan kedua indera kata itu, sehingga tidak mengherankan ketika orang-orang mencampurkannya.
Statistik (ilmu) banyak tentang memilih strategi dan memilih strategi terbaik bahkan jika kita hanya bisa menerapkannya sekali. Beberapa kali ketika saya (dan yang lain) mengajarkan probabilitas, kami menggunakan masalah klasik Monty Hall (3 pintu, 2 kambing, 1 mobil) untuk memotivasi dan kami menunjukkan bagaimana kami dapat memperkirakan probabilitas dengan memainkan permainan beberapa kali (bukan untuk hadiah ) dan kita dapat melihat bahwa strategi "switch" menang 2/3 dari waktu dan strategi "stay" hanya menang 1/3 dari waktu. Sekarang, jika kita memiliki kesempatan untuk memainkan permainan dalam satu waktu, kita akan mengetahui beberapa hal tentang strategi mana yang memberikan peluang lebih baik untuk menang.
Contoh operasi serupa, Anda hanya akan memiliki operasi (atau tidak memiliki operasi) sekali, tetapi tidakkah Anda ingin tahu strategi mana yang menguntungkan lebih banyak orang? Jika pilihan Anda adalah operasi dengan peluang lebih besar dari 0% untuk bertahan hidup atau tidak ada operasi dan 0% untuk bertahan hidup, maka ya ada sedikit perbedaan antara operasi yang memiliki kelangsungan hidup 51% dan kelangsungan hidup 99,9%. Tetapi bagaimana jika ada pilihan lain juga, Anda dapat memilih antara operasi, tidak melakukan apa-apa (yang memiliki 25% kelangsungan hidup) atau perubahan pola makan dan olahraga yang memiliki 75% kelangsungan hidup (tetapi membutuhkan usaha dari pihak Anda), tidak akan tidak Anda peduli jika opsi operasi memiliki kelangsungan hidup 51% vs 99%?
Juga pertimbangkan dokter, ia akan melakukan lebih dari sekedar operasi Anda. Jika operasi memiliki 99,9% kelangsungan hidup maka ia tidak memiliki alasan untuk mempertimbangkan alternatif, tetapi jika hanya memiliki 51% kelangsungan hidup maka sementara itu mungkin menjadi pilihan terbaik saat ini, ia harus mencari alternatif lain yang meningkatkan kelangsungan hidup itu. Ya bahkan dengan kelangsungan hidup 90% dia akan kehilangan beberapa pasien, tetapi strategi mana yang memberinya peluang terbaik untuk menyelamatkan sebagian besar pasien?
Pagi ini saya mengenakan sabuk pengaman saya saat mengemudi (strategi saya yang biasa), tetapi tidak mengalami kecelakaan, jadi apakah strategi saya hanya buang-buang waktu? Jika saya tahu kapan saya akan mengalami kecelakaan maka saya bisa menghemat waktu hanya dengan mengenakan sabuk pengaman pada kesempatan itu dan bukan pada yang lain. Tapi saya tidak tahu kapan saya akan mengalami kecelakaan jadi saya akan tetap memakai strategi sabuk pengaman saya karena saya percaya itu akan memberi saya peluang terbaik jika saya pernah mengalami kecelakaan bahkan jika itu berarti membuang sedikit waktu dan upaya dalam persentase tinggi (semoga 100%) kali tidak ada kecelakaan.
sumber
Hanya karena Anda tidak menggunakan statistik dalam kehidupan sehari-hari Anda tidak berarti bidang itu tidak secara langsung memengaruhi Anda. Ketika Anda berada di dokter dan mereka merekomendasikan satu pengobatan di atas yang lain, Anda dapat bertaruh bahwa di balik rekomendasi itu terdapat banyak uji klinis yang menggunakan statistik untuk menginterpretasikan hasil percobaan mereka.
Ternyata konsep nilai yang diharapkan juga sangat berguna walaupun Anda tidak secara pribadi menggunakan konsep tersebut. Contoh Anda mempertaruhkan simpanan seumur hidup Anda gagal memperhitungkan seberapa besar risiko Anda. Situasi lain mungkin mendapati diri Anda kurang berisiko, atau di mana tidak ada hasil yang membawa bencana. Konteks bisnis, keuangan, aktuaria dan lain-lain adalah contohnya. Mungkin Anda mengeluarkan polis asuransi rumah - maka tiba-tiba mengetahui kemungkinan gempa bumi yang terjadi dalam beberapa periode waktu tertentu sangat berarti.
Pada akhirnya, statistik adalah cara yang bagus untuk menghadapi ketidakpastian. Contoh terakhir Anda, Anda membuat beberapa data tentang tempat-tempat yang ingin Anda kunjungi dan mengklaim bahwa statistik akan mengatakan bahwa Anda tidak akan pernah menemukan tempat di Asia yang Anda sukai. Ini salah. Tentu saja data ini akan membuat Anda percaya bahwa Asia lebih kecil kemungkinannya memiliki tempat yang Anda sukai, tetapi Anda dapat menetapkan keyakinan Anda sebelumnya untuk menjadi apa pun yang Anda suka, dan statistik akan memberi tahu Anda cara memperbarui kepercayaan Anda dengan diberikannya data baru. Selain itu, memungkinkan Anda untuk memodifikasi keyakinan Anda dengan cara berprinsip yang akan memungkinkan Anda untuk bertindak secara rasional di hadapan ketidakpastian.
sumber
Dunia stokastik tidak deterministik. Jika itu deterministik, fisikawan akan memerintah dunia dan ahli statistik akan kehilangan pekerjaan. Tetapi kenyataannya adalah bahwa ahli statistik sangat dibutuhkan di hampir setiap disiplin ilmu. Itu bukan untuk mengatakan bahwa tidak ada tempat untuk fisika dan ilmu pengetahuan lainnya tetapi statistik bekerja bersama dengan ilmu pengetahuan dan merupakan dasar bagi banyak penemuan ilmiah.
Cukup obrolan dan turun ke spesifik. Saya telah bekerja selama 17 tahun terakhir di industri medis, pertama di perangkat medis, kemudian farmasi, dan sekarang penelitian medis umum. Obat-obatan dan peralatan medis yang meningkatkan kualitas hidup dan sering menyelamatkan atau memperpanjang usia dikembangkan dan disetujui di negara ini dan di seluruh dunia secara teratur. Di AS persetujuan memerlukan bukti keamanan dan kemanjuran sebelum FDA akan memungkinkan obat atau perangkat medis untuk dipasarkan. Bukti ke FDA berasal dari uji klinis secara bertahap. Semua uji klinis memerlukan desain statistik dan metode analisis yang valid. Tidak ada yang sempurna. Obat-obatan bekerja dengan baik untuk beberapa orang sementara yang lain mungkin tidak merespons atau akan memiliki efek samping (reaksi buruk yang dapat menyebabkan penyakit atau kematian). Uji coba memisahkan obat yang tidak efektif dari yang efektif. Sebagian besar obat-obatan gagal dan sering ada siklus sepuluh tahun dari pengembangan tahap awal hingga akhir fase III dengan persetujuan dan pemasaran pada akhir uji coba. Surveilans pasca-pasar yang juga memerlukan statistik kemudian diterapkan untuk memastikan bahwa obat tersebut bekerja dengan cukup baik untuk populasi umum. Kadang-kadang populasi umum yang disetujui untuk obat ini adalah kelompok yang kurang restriktif dibandingkan pasien yang memenuhi syarat untuk uji klinis. Jadi kadang-kadang narkoba ternyata berbahaya dan ditarik dari pasar. Statistik membantu dalam semua aspek keamanan obat. Surveilans pasca-pasar yang juga memerlukan statistik kemudian diterapkan untuk memastikan bahwa obat tersebut bekerja dengan cukup baik untuk populasi umum. Kadang-kadang populasi umum yang disetujui untuk obat ini adalah kelompok yang kurang restriktif dibandingkan pasien yang memenuhi syarat untuk uji klinis. Jadi kadang-kadang narkoba ternyata berbahaya dan ditarik dari pasar. Statistik membantu dalam semua aspek keamanan obat. Surveilans pasca-pasar yang juga memerlukan statistik kemudian diterapkan untuk memastikan bahwa obat tersebut bekerja dengan cukup baik untuk populasi umum. Kadang-kadang populasi umum yang disetujui untuk obat ini adalah kelompok yang kurang restriktif dibandingkan pasien yang memenuhi syarat untuk uji klinis. Jadi kadang-kadang narkoba ternyata berbahaya dan ditarik dari pasar. Statistik membantu dalam semua aspek keamanan obat.
Statistik tidak sempurna. Kita hidup dengan beberapa kesalahan karena keacakan dan ketidakpastian. Tapi itu dikendalikan dan hidup kita lebih baik dan kesalahan dikurangi dari apa yang akan terjadi jika ilmu statistik tidak terlibat.
sumber
Saya sendiri memiliki keraguan yang sama tentang kegunaan probabilitas, dan statistik, ketika harus mengambil keputusan tentang satu peristiwa. Menurut pendapat saya, mengetahui probabilitas, nyata atau diperkirakan, sangat penting ketika tujuannya adalah memperkirakan hasil sampel, baik itu kejadian tunggal yang diulang beberapa kali atau sampel tenggelam dari populasi tertentu. Singkatnya, mengetahui probabilitas lebih masuk akal bagi kasino yang, berdasarkan perhitungan probabilitas dapat menempatkan aturan yang menjamin dia akan menang dalam jangka panjang (setelah banyak bermain) dan bukan untuk seorang penjudi yang berpura-pura bermain satu kali, jadi dia akan menang atau kalah (ini adalah hasil ketika percobaan dijalankan satu kali). Ini juga penting bagi para jenderal yang merenungkan mengirim prajurit mereka ke pertempuran dengan risiko (kemungkinan) kehilangan 10% dari mereka, tetapi tidak untuk solder tertentu (katakanlah, John) yang hanya akan mati atau bertahan hidup. Ada begitu banyak contoh seperti ini dalam kehidupan nyata.
Poin yang ingin saya sampaikan adalah, Probabilitas dan Statistik, tidak hanya berguna dalam kehidupan nyata tetapi, lebih tepatnya, mereka adalah alat untuk semua penelitian ilmiah modern dan aturan pengambilan keputusan. Namun, tidak benar untuk mengatakan bahwa rasionalitas berimplikasi pada probabilitas suatu peristiwa tunggal, tanpa niat atau kemungkinan mengulanginya, untuk memperkirakan hasilnya. Kecenderungan kemungkinan untuk mempengaruhi keputusan individu tertentu, berdasarkan tingkat keengganannya terhadap risiko, jelas subyektif. Penghindaran risiko dan pencinta risiko memiliki sikap (keputusan) yang berbeda terhadap lotere yang sama (nilai yang diharapkan sama).
sumber
Panjang dan pendeknya adalah bahwa probabilitas adalah generalisasi unik dari logika benar / salah biasa untuk derajat kepercayaan antara 0 dan 1. Ini adalah apa yang disebut interpretasi Bayesian logis tentang probabilitas, berasal dari RT Cox dan kemudian diperjuangkan oleh ET Jaynes.
Selanjutnya di bawah asumsi yang lemah dapat ditunjukkan bahwa cara yang tepat untuk memesan hasil yang tidak pasti dengan preferensi adalah memesannya dengan utilitas yang diharapkan, dengan perkiraan yang diambil sehubungan dengan distribusi probabilitas atas hasil.
Lihat Robert Clemen, "Membuat Keputusan Sulit", untuk pengantar dan paparan tentang analisis keputusan terapan yang didasarkan pada probabilitas Bayesian dan utilitas yang diharapkan.
Anda benar-benar skeptis tentang statistik frequentist konvensional; oleh desain penemunya (RA Fisher, J. Neyman, E. Pearson) terbatas pada acara berulang. Tetapi banyak masalah sehari-hari tidak melibatkan peristiwa berulang. Apa yang harus dilakukan? Pendekatan khas adalah beberapa kombinasi memaksa pasak persegi ke dalam lubang bundar, dan memindahkan tiang gawang. Memalukan, sungguh.
sumber
Saya ragu dengan statistik karena alasan berikut.
Saya yakin siapa pun yang tidak memiliki gelar sarjana dalam statistik tidak tahu apa yang mereka lakukan. Unf. ada jutaan orang di seluruh dunia yang melakukan penelitian tanpa gelar sarjana dalam statistik. Saya adalah seorang sarjana matematika di Univeristy of Maryland College, Park. Saya mengambil 4 400 kelas matematika. Semua guru lakukan adalah mengajari Anda cara menghitung barang. Tidak ada yang mengajari saya cara memahami apa pun atau melakukan analisis statistik apa pun kecuali untuk pengujian hipotesis, yang tidak masuk akal karena 2 alasan.
1. Untuk setiap tes hipotesis yang diajarkan kepada saya, saya harus membuat asumsi sebelumnya. Tidak ada yang mengajari saya asumsi mana yang harus saya mulai. 2. Nilai P tidak masuk akal secara logis. Gelar sarjana dalam statistik mungkin mengajarkan Anda apa nilai sebenarnya. Namun, saya yakin tidak ada sarjana yang tahu cara menggunakannya. Definisi sarjana mengasumsikan probabilitas sesuatu yang tergantung pada hipotesis yang benar. Secara logis, definisi itu tidak masuk akal sama sekali. Lebih buruk lagi, NOBODY pernah mengatakan kepada saya dari mana probabilitas itu berasal. Saya sebenarnya sudah mengirim email ke hampir seluruh departemen matematika saya (lebih dari 200 orang) jika ada yang bisa memberi saya jawaban. Respons yang paling populer dan satu-satunya adalah "orang harus MENGASUMKAN tingkat kesalahan untuk probabilitas" (Ketika saya bertanya kepada orang-orang bagaimana ini dilakukan, mereka semua menjawab saya "
Hal yang sama terjadi ketika saya mencari Google apa arti dari nilai ap. Ini menuntun saya pada kesimpulan ...
Bahkan sig. sejumlah profesor matematika dan statistik tidak memiliki petunjuk apa logika di balik statistik. Saya tidak berharap orang memiliki pengetahuan yang mendalam. Namun, saya punya perasaan yang bahkan sig. % riset dan profesor tidak memahami logika apa pun yang mendasari statistik.
Kesalahan statistik tidak sama dengan kesalahan aktual. Karena orang suka menggunakan statistik untuk memperoleh taksiran untuk hal-hal yang besar, orang suka menggunakan kesalahan statistik untuk "menutupi" fakta bahwa mereka tidak tahu apa kesalahan sebenarnya.
Orang menggunakan sampel kecil untuk populasi besar karena teori statistik memberi tahu mereka bahwa mereka bisa. Saya belajar dari salah satu kursus kuliah saya, bahwa orang-orang suka menggunakan data yang merupakan perkiraan dari sekitar 30 sekolah di negara itu untuk menunjukkan bahwa ada beberapa insiden kekerasan di sekolah-sekolah di seluruh negeri. Ada sekitar 100.000 sekolah. Kedengarannya gila. Seluruh gerakan populer didasarkan dari sekitar 30 sekolah di seluruh negeri.
Orang suka menjadikan beban pembuktian statistik. Higgs Bossom tidak pernah ditemukan. Ditemukan secara statistik, tetapi itu tidak berarti apa-apa. Sesuatu yang ditemukan murni secara statistik tidak berguna karena tidak ada yang tahu keakuratan statistik.
Orang-orang suka menggunakan statistik untuk membuat keputusan penting. Statistik dapat digunakan sebagai panduan, tetapi tidak ada yang tahu seberapa akuratnya. Hanya karena masalah yang tampaknya mustahil untuk diselesaikan tidak berarti bahwa statistik adalah hal terbaik berikutnya. Fakta bahwa pengujian DNA didasarkan pada statistik membuat saya merinding. Bisakah saya diberikan hukuman mati semata-mata karena statistik? Bisakah seorang pembunuh dibebaskan dari penjara semata-mata karena statistik?
Saya percaya statistik bisa bermanfaat, tetapi hanya jika tidak digunakan sebagai kesimpulan. Saya percaya statistik dapat memberi tahu kita apa kemungkinan yang ada. Maka logika, bukan logika statistik harus digunakan untuk membuktikan kemungkinan mana yang benar.
sumber