Ini semacam pertanyaan terbuka tapi saya ingin jelas. Mengingat populasi yang cukup Anda mungkin dapat belajar sesuatu (ini adalah bagian terbuka) tetapi apa pun yang Anda pelajari tentang populasi Anda, kapan itu bisa berlaku untuk anggota populasi?
Dari apa yang saya pahami tentang statistik, itu tidak pernah berlaku untuk satu anggota populasi, namun, sering kali saya menemukan diri saya dalam diskusi di mana orang lain berkata, "Saya membaca bahwa 10% populasi dunia memiliki penyakit ini" dan terus menyimpulkan bahwa setiap orang kesepuluh di dalam ruangan memiliki penyakit ini.
Saya mengerti bahwa sepuluh orang di ruangan ini bukan sampel yang cukup besar untuk statistik yang relevan tetapi tampaknya tidak banyak.
Lalu ada hal tentang sampel yang cukup besar . Anda hanya perlu menyelidiki populasi yang cukup besar untuk mendapatkan statistik yang andal. Namun, bukankah ini sebanding dengan kompleksitas statistik? Jika saya mengukur sesuatu yang sangat langka, bukankah itu berarti saya perlu sampel yang jauh lebih besar untuk dapat menentukan relevansi untuk statistik seperti itu?
Masalahnya adalah, saya benar-benar mempertanyakan validitas surat kabar atau artikel mana pun ketika statistik terlibat, cara mereka digunakan untuk membangun kepercayaan.
Itu sedikit latar belakang.
Kembali ke pertanyaan, dengan cara apa Anda TIDAK BISA atau mungkin Anda TIDAK menggunakan statistik untuk membentuk argumen . Saya meniadakan pertanyaan karena saya ingin mengetahui lebih lanjut tentang kesalahpahaman umum tentang statistik.
Jawaban:
Untuk membuat kesimpulan tentang suatu kelompok berdasarkan populasi, kelompok tersebut harus mewakili populasi dan independen. Orang lain telah membahas hal ini, jadi saya tidak akan membahas bagian ini.
Satu hal lain yang perlu dipertimbangkan adalah probabilitas yang tidak intuitif. Mari kita asumsikan bahwa kita memiliki kelompok 10 orang yang independen dan mewakili populasi (sampel acak) dan kita tahu bahwa dalam populasi 10% memiliki karakteristik tertentu. Oleh karena itu masing-masing dari 10 orang memiliki peluang 10% untuk memiliki karakteristik. Asumsi umum adalah bahwa cukup pasti bahwa setidaknya 1 akan memiliki karakteristik. Tapi itu adalah masalah binomial sederhana, kita dapat menghitung probabilitas bahwa tidak ada dari 10 yang memiliki karakteristik, yaitu sekitar 35% (konvergen ke 1 / e untuk kelompok yang lebih besar / probabilitas yang lebih kecil) yang jauh lebih tinggi daripada perkiraan kebanyakan orang. Ada juga peluang 26% bahwa 2 orang atau lebih memiliki karakteristik.
sumber
Kecuali orang-orang di ruangan itu adalah sampel acak dari populasi dunia, kesimpulan apa pun berdasarkan statistik tentang populasi dunia akan sangat mencurigakan. Satu dari setiap 5 orang di dunia adalah orang Cina, tetapi tidak satu pun dari lima anak saya ...
sumber
Untuk mengatasi penerapan statistik yang berlebihan pada sampel-sampel kecil, saya sarankan untuk membalas dengan lelucon-lelucon terkenal ("Saya sangat senang, ibu saya hamil lagi dan adik bayi saya adalah orang China." "Mengapa?" "Saya telah membaca bahwa setiap bayi keempat adalah Cina. ").
Sebenarnya, saya merekomendasikan lelucon untuk mengatasi semua jenis kesalahpahaman dalam statistik, lihat http://xkcd.com/552/ untuk korelasi dan sebab-akibat.
Masalah dengan artikel surat kabar jarang fakta bahwa mereka memperlakukan fenomena langka.
Paradoks Simpsons muncul sebagai contoh bahwa statistik jarang dapat digunakan tanpa analisis penyebabnya.
sumber
Ada artikel yang menarik oleh Mary Gray tentang penyalahgunaan statistik dalam kasus-kasus pengadilan dan hal-hal seperti itu ...
Gray, Mary W.; Statistik dan Hukum. Matematika Mag. 56 (1983), no. 2, 67–81
sumber
Ketika sampai pada logika dan akal sehat, berhati-hatilah, keduanya jarang terjadi. Dengan "diskusi" tertentu Anda mungkin mengenali sesuatu ...... titik argumen adalah argumen.
http://www.wired.com/wiredscience/2011/05/the-sad-reason-we-reason/
sumber
Analisis statistik atau data statistik?
Saya pikir contoh ini dalam pertanyaan Anda berkaitan dengan data statistik: "Saya membaca bahwa 10% populasi dunia menderita penyakit ini". Dengan kata lain, dalam contoh ini seseorang menggunakan angka untuk membantu mengkomunikasikan kuantitas secara lebih efektif daripada hanya mengatakan 'banyak orang'.
Dugaan saya adalah bahwa jawaban untuk pertanyaan Anda tersembunyi dalam motivasi pembicara tentang mengapa dia menggunakan angka. Bisa jadi untuk mengomunikasikan gagasan yang lebih baik atau bisa untuk menunjukkan otoritas atau bisa untuk menyilaukan pendengar. Hal yang baik tentang menyatakan angka daripada mengatakan 'sangat besar' adalah bahwa orang dapat menyangkal angka tersebut. Lihat ide Popper tentang sanggahan.
sumber
Hipotesa:SEBUAH
(Buku Teks) Hasil: Jangan menolakSEBUAH (σ= c )
Pernyataan Anda:SEBUAH tahan dengan probabilitas σ !
Yang benar adalah: Dalam hal ini, Anda tidak tahu apa-apa. Jika Anda ingin "membuktikan"SEBUAH , hipotesis Anda harus ¬ A ; tolak denganσ untuk mendapatkan pernyataan yang diinginkan.
sumber
Itu tidak benar. Tergantung aplikasinya.
Contoh: peluruhan nuklir dalam fisika. Tingkat peluruhan, menentukan probabilitas peluruhan setiap inti tunggal . Anda mengambil nukleus apa pun dan itu akan memiliki kemungkinan pembusukan yang persis sama, yang Anda buat dengan eksperimen pada sampel.
sumber