Dalam posting ini kami mengajukan pertanyaan tentang fenomena alam yang disebut manusia berusaha untuk menemukan keputusan dengan menghitung suara . Insiden spesifik dari fenomena alam sedemikian rupa sehingga pertanyaan ini adalah tentang Brexit .
Catatan: pertanyaannya bukan tentang politik. Tujuannya adalah untuk mencoba mendiskusikan fenomena alam seperti itu dari sudut pandang statistik berdasarkan pengamatan.
Pertanyaan spesifik adalah:
- Pertanyaan: Apa arti Brexit untuk meninggalkan artinya? Misalnya apakah itu berarti publik benar-benar ingin meninggalkan UE? Apakah itu hanya berarti bahwa publik tidak yakin dan perlu lebih banyak waktu untuk berpikir? Atau itu sesuatu yang lain?
Asumsi 1: tidak ada kesalahan dalam proses pemilihan.
statistical-significance
voting-system
manusia gua
sumber
sumber
Jawaban:
Saya setuju dengan @Underminer bahwa tidak ada kesalahan pengambilan sampel, tetapi bukan karena sampel besar, tetapi karena tidak ada pengambilan sampel yang terlibat . Tidak ada yang disampel untuk memilih. Jelas ada sebagian kecil orang yang ingin memilih tetapi, tidak dapat (misalnya mengalami kecelakaan mobil pada hari ini), atau yang memberikan suara tidak sah, tetapi itulah satu-satunya "pengambilan sampel" di sini.
Hasilnya tepat, tidak ada kesalahan yang terlibat karena seluruh populasi mengambil bagian dalam pemungutan suara (beberapa mengambil bagian dengan tidak mengambil bagian di dalamnya). Beberapa orang memutuskan untuk memilih, beberapa tidak. Beberapa memutuskan untuk memilih cuti, beberapa tidak. Demokrasi bukan tentang signifikansi statistik, tetapi tentang apa yang sebenarnya terjadi . Voting tidak dimaksudkan untuk belajar tentang pendapat orang, tetapi untuk membuat keputusan. Sebenarnya, orang kadang-kadang tidak memilih sesuai dengan apa yang mereka pikirkan, tetapi untuk mewujudkan, atau mencapai sesuatu . Misalnya, dalam pemilihan, orang dapat memilih bukan untuk kandidat pilihan mereka, tetapi untuk kandidat pilihan kedua mereka jika mereka berpikir dia memiliki peluang lebih besar untuk menang.
sumber
51,9% adalah persentase pemilih yang ingin pergi . Karena ukuran sampel sangat besar (> 33 juta), hampir tidak ada kesalahan pengambilan sampel secara acak.
Pengujian signifikansi statistik akan mencoba untuk menentukan apakah perbedaan dalam tetap dan cuti dapat dijelaskan oleh kesalahan sampling acak saja, dan perbedaannya akan signifikan (lihat jawaban @ manusia gua)
Masalah dengan pendekatan ini adalah bahwa signifikansi statistik membuat asumsi yang sangat kuat bahwa sampel tersebut mewakili seluruh populasi (seluruh Inggris), bukan hanya mereka yang memberikan suara.
Tingkat non-respons (mereka yang tidak memilih) sangat penting dalam menentukan apakah lebih dari setengah dari seluruh Inggris ingin 'pergi', dan sulit untuk diukur. Bias non-respons dibuat ketika subkelompok yang cenderung memilih memiliki pandangan yang berbeda secara sistematis. Berdasarkan jajak pendapat keluar, misalnya, milenium cenderung memilih, tetapi lebih cenderung memilih untuk tetap , yang bias hasilnya ketika mencoba untuk mewakili populasi seluruh Inggris.
Untuk alasan ini, pengujian signifikansi statistik dalam arti tradisional sebagian besar tidak pantas .
Asumsi: Kita perlu mendefinisikan beberapa istilah agar semua ini masuk akal dan menghindari diskusi politik tentang apa yang ingin dicapai oleh pemungutan suara. Inilah definisi saya:
Populasi: Setiap orang yang tinggal di Inggris
Sampling Frame: Setiap orang yang berhak memilih dapat memilih
Metodologi Pengambilan Sampel: Respons sukarela, tindakan memilih berpartisipasi dalam survei
Contoh: Individu yang benar-benar memilih
Dalam pengaturan ini, proporsi sampel dapat digunakan (baik atau buruk) untuk memperkirakan persentase semua orang yang condong ke arah tetap (atau pergi ).
sumber
Anda bertanya
Ini berarti 51,9% pemilih memilih untuk pergi.
Suara terdiri "cuti" dan 1617421887 "tetap", menunjukkan 1216146297 pemilih yang memenuhi syarat tidak memilih dan sekitar 18 juta penduduk tidak berhak memilih. Karena baik koleksi pemilih yang sebenarnya maupun koleksi pemilih yang memenuhi syarat adalah "publik" dan tidak ada sampel representatif (acak, tidak memihak, pilih kata sifat yang relevan) dari "publik", suara Brexit 51,9% tidak memberi tahu Anda yang kedua dan pertanyaan selanjutnya.12931353 18
Dimungkinkan untuk membuat kuesioner yang responsif terhadap pertanyaan Anda. Ini sepertinya bukan yang terjadi dalam referendum seperti yang diterapkan.
sumber
TL; DR
Saya mensimulasikan populasi yang tidak pasti di bawah (di bawah perincian ) untuk kali, dan kemudian mengukur probabilitas mengamati suara cuti ≥ 51,9 % di bawah populasi yang tidak pasti seperti itu . Ini memberi saya probabilitas simulasi bahwa populasi yang tidak pasti dapat mencapai suara cuti yang 51,9 % atau lebih besar.R = 1000 ≥ 51,9 % 51,9 %
Probabilitas simulasi cuti di bawah populasi yang tidak pasti ini adalah .0
Mungkin berlebihan, tetapi saya juga melakukan hal yang sama tetapi dengan tetap mengukur probabilitas bahwa populasi yang tidak pasti untuk mendapatkan suara tetap .≤ 48,1 %
Probabilitas simulasi untuk tetap di bawah populasi yang tidak pasti ini juga .0
Oleh karena itu saya menyimpulkan bahwa suara Brexit bukan efek samping berisik dari populasi yang tidak yakin atau bingung . Tampaknya ada alasan sistematis yang membuat mereka meninggalkan Uni Eropa.
Saya mengunggah kode simulator di sini: https://github.com/Al-Caveman/Brexit
Detail
Dengan Asumsi 1 , kemungkinan jawaban (atau hipotesis) adalah:
Catatan: bahwa tidak mungkin publik ingin tetap percaya diri karena kami telah mengesampingkan kesalahan pemilihan.
Untuk mengukur probabilitas ini, kita perlu mengetahui distribusi populasi Inggris yang tidak pasti dalam sistem pemilihan biner seperti Brexit. Oleh karena itu, langkah pertama saya adalah mensimulasikan distribusi ini dengan mengikuti asumsi di bawah ini:
Dalam pandangan saya asumsi ini adil / masuk akal.
Selain itu, kami memodelkan kampanye cuti dan tetap sebagai dua proses berbeda sebagai berikut:
dimana:
tunduk pada batasan berikut:
Oleh karena itu, kami mendefinisikan array output sebagai berikut:
Dengan kata lain:
sumber
Anda dapat mengajukan pertanyaan yang sedikit berbeda: Dengan anggapan bahwa 50% dari populasi yang sangat besar memilih "Ya", dan Anda bertanya sampel acak ukuran S, berapa probabilitas bahwa 51,9% dari sampel Anda menjawab "Ya", tergantung pada ukuran sampel?
sumber
Ini adalah solusi lain yang menggunakan metode analitis dan bukan simulasi.
( dihitung oleh Wolframalpha )8.39663381928984×10−10105024
Dan ini adalah probabilitas memiliki dari cuti suara populasi yang tidak pasti .≥51.9%
sumber