Mengapa pengambilan sampel statistik (?) Bekerja untuk politik (misalnya Gallup)?

14

Jajak pendapat di luar sana (katakanlah, Gallup) sampel beberapa jumlah orang sangat rendah dibandingkan dengan ukuran populasi (misalnya mungkin seribu orang dari ratusan juta).

Sekarang, bagi saya, sampling populasi sebagai sarana untuk memperkirakan statistik populasi masuk akal ketika Anda memiliki alasan kuat untuk percaya sampel mewakili populasi (atau, serupa, dari sampel lain ) .

Sebagai contoh, pengambilan sampel jelas masuk akal untuk studi medis, karena kita tahu apriori bahwa manusia semua memiliki genom yang sangat mirip dan bahwa faktor ini membuat tubuh mereka berperilaku sama.
Perhatikan bahwa ini bukan semacam kopling longgar - genom adalah faktor penentu yang sangat kuat .

Namun, saya hanya tidak mengerti apa yang membenarkan menggunakan ukuran sampel rendah untuk hal-hal seperti jajak pendapat politik.

Saya dapat membeli bahwa mungkin 80-90% orang di lingkungan tertentu memberikan suara yang sama untuk presiden (karena latar belakang sosial ekonomi / pendidikan yang serupa), tetapi ini tampaknya tidak membenarkan jumlah sampel yang sangat rendah. Secara harfiah tidak ada alasan kuat (setidaknya bagi saya) mengapa 1000 pemilih acak harus berperilaku seperti 200 juta pemilih lainnya.

Bagi saya, Anda membutuhkan setidaknya (katakanlah) 100 × jumlah itu. Mengapa? Saya dapat memikirkan banyak alasan, misalnya:

  1. Ada ~ 22.000 kantor di California . Orang-orang tumbuh begitu berbeda dalam latar belakang ekonomi dan pendidikan mereka sehingga jajak pendapat dengan ukuran 1000 tampaknya sangat kecil. Bagaimana Anda bisa merangkum seluruh kawasan dengan rata-rata <1 orang?

  2. Orang pada umumnya tidak dapat mengubah respons tubuh mereka terhadap obat-obatan, tetapi mereka dapat mengubah pendapat mereka tentang politik hanya dengan memikirkannya. Cara saya melihatnya, tidak ada faktor pemaksa yang mirip dengan DNA dalam kedokteran ketika Anda berurusan dengan politik. Paling- paling saya bayangkan harus ada kantong kecil korelasi.

Namun entah bagaimana, jajak pendapat seperti ini sepertinya ... berfungsi? Atau setidaknya orang-orang tampaknya berpikir begitu?
Tetapi mengapa mereka harus melakukannya? Mungkin secara mendasar saya tidak mengerti pengambilan sampel ? Bisakah seseorang menjelaskan?
Aku hanya tidak bisa menerima jajak pendapat yang saya lihat dengan serius, tapi saya merasa kurang lebih sendirian dalam hal ini ...

pengguna541686
sumber
4
"Pengambilan sampel jelas masuk akal untuk studi medis, karena kita tahu apriori bahwa manusia semua memiliki genom yang sangat mirip." Saya tidak memiliki latar belakang medis, tetapi apakah benar - benar DNA kita kurang berbeda dari pandangan politik kita? Jika demikian, mengapa begitu sulit untuk mempelajari genetika dan mengapa kita tidak memiliki pemahaman penuh tentang genetika? Saya berani bertaruh bahwa jika Anda mengambil dua orang secara acak maka mereka akan lebih cenderung memiliki pandangan politik yang sama, maka DNA yang sama.
Tim
3
@Tim: "Saya berani bertaruh bahwa jika Anda mengambil dua orang secara acak maka mereka akan lebih cenderung memiliki pandangan politik yang sama, maka DNA yang sama." Seberapa banyak Anda ingin bertaruh? google.com/search?q=dna+similarity+between+humans
user541686
2
Tetapi bukankah perbedaan 0,5% hal yang paling penting ketika Anda membuat perbandingan seperti itu? Juga, kami berbagi 60% gen dengan lalat , jadi saya kira kami bisa mengambil sampel manusia dan lalat untuk penelitian medis? Dibandingkan: pada 2008 Obama mendapat 53% suara dalam pemilihan presiden AS. Selain itu, saya berpendapat bahwa ketika meneliti obat yang menyelamatkan jiwa tetapi berpotensi berbahaya, Anda harus lebih berhati-hati dalam pengambilan sampel kemudian ketika melakukan penelitian tentang preferensi untuk menggunakan sabun yang diproduksi oleh perusahaan A vs B, atau untuk kumpulan pendapat.
Tim
2
@ user2338816: "Ini meyakinkan karena secara historis akurat" kurang seperti matematika dan lebih seperti sains. Saya benar-benar bersedia untuk membelinya dengan alasan ilmiah (karena itulah cara ilmu pengetahuan berputar), tetapi tidak murni dengan alasan matematika (berdasarkan bukti).
user541686
1
Saya akan menantang klaim (hati-hati) bahwa jajak pendapat bekerja untuk pemilihan. Saya tidak ingat jajak pendapat bahkan dekat dengan hasil aktual pemilihan di mana saya berasal. Ada terlalu banyak faktor yang tidak dapat Anda pertanggungjawabkan - misalnya, dengan kehadiran ~ 60% kami, kemungkinan besar Anda akan mengambil sampel seseorang yang tidak akan memilih daripada yang tidak. Berpartisipasi dalam survei lebih mudah daripada memilih, dan kadang-kadang Anda bahkan dibayar untuk itu. Beberapa partai memiliki kehadiran yang jauh lebih tinggi daripada yang lain (seperti partai komunis). Anda perlu mengutip penyimpangan serta "hasil" dalam pengambilan sampel apa pun.
Luaan

Jawaban:

13

Sepertinya Anda membayangkan model pengambilan sampel yang sangat sederhana.

Model paling sederhana untuk pengambilan sampel disebut aptly Simple Random Sampling . Anda memilih subset dari populasi (misalnya, dengan memutar nomor telepon secara acak) dan bertanya siapa pun yang menjawab bagaimana mereka memberikan suara. Jika 487 mengatakan Clinton, 463 mengatakan Trump, dan sisanya memberi Anda jawaban aneh, maka perusahaan pemungutan suara akan melaporkan bahwa 49% pemilih lebih memilih Clinton, sementara 46% memilih Trump. Namun, perusahaan pemungutan suara melakukan lebih dari ini. Sampel acak sederhana memberikan bobot yang sama untuk setiap titik data. Namun, anggaplah sampel Anda mengandung - secara kebetulan - 600 pria dan 400 wanita, yang jelas tidak mewakili populasi secara keseluruhan. Jika pria sebagai kelompok condong ke satu arah, sementara wanita condong ke arah yang lain, ini akan membiasakan hasil Anda. Namun, karena kami memiliki statistik demografis yang cukup baik, Anda dapat mempertimbangkan *tanggapan dengan menghitung tanggapan perempuan sedikit lebih banyak dan laki-laki sedikit lebih sedikit, sehingga tanggapan tertimbang mewakili populasi yang lebih baik. Organisasi pemungutan suara memiliki model penimbangan yang lebih rumit yang dapat membuat sampel yang tidak representatif menyerupai yang lebih representatif.

Gagasan untuk menimbang respons sampel didasarkan pada landasan statistik yang cukup kuat, tetapi ada beberapa fleksibilitas dalam memilih faktor apa yang berkontribusi terhadap bobot. Sebagian besar lembaga survei melakukan reweight berdasarkan faktor demografis seperti jenis kelamin, usia, dan ras. Dengan ini, Anda mungkin berpikir bahwa identifikasi partai (Demokrat, Republik, dll) juga harus dimasukkan, tetapi ternyata sebagian besar perusahaan pemungutan suara tidak menggunakannya dalam bobot mereka: identifikasi partai (diri) dihimpit dengan pilihan pemilih. dengan cara yang membuatnya kurang bermanfaat.

Banyak pakaian pemungutan suara juga melaporkan hasilnya di antara "kemungkinan pemilih". Dalam hal ini, responden dipilih atau dibobot berdasarkan kemungkinan bahwa mereka akan benar-benar muncul ke tempat pemungutan suara. Model ini tidak diragukan lagi didorong oleh data, tetapi pilihan faktor yang tepat memungkinkan fleksibilitas. Sebagai contoh, termasuk interaksi antara kandidat dan ras pemilih (atau gender) bahkan tidak masuk akal sampai 2008 atau 2016, tetapi saya menduga mereka memiliki kekuatan prediksi sekarang.

Secara teori, Anda dapat memasukkan segala macam hal sebagai faktor penimbangan: preferensi musik, warna mata, dll. Namun, faktor demografis adalah pilihan populer untuk faktor penimbangan karena:

  • Secara empiris, mereka berkorelasi baik dengan perilaku pemilih. Jelas, tidak ada hukum berbahan besi yang 'memaksa' orang kulit putih untuk menjadi ramping, tetapi selama lima puluh tahun terakhir, mereka cenderung melakukannya.
    • Nilai populasi diketahui dengan baik (misalnya, dari sensus atau Catatan Penting)

Namun, lembaga survei juga melihat berita yang sama dengan yang dilakukan orang lain, dan dapat menyesuaikan variabel bobot jika perlu.

Ada juga beberapa "faktor fudge" yang kadang-kadang digunakan untuk menjelaskan hasil jajak pendapat. Misalnya, responden terkadang enggan memberikan jawaban yang "tidak diinginkan secara sosial". The Bradley Effect berpendapat bahwa pemilih kulit putih kadang-kadang mengecilkan dukungan mereka bagi calon putih berjalan terhadap minoritas untuk menghindari muncul rasis. Ini dinamai Tom Bradley, seorang kandidat gubernur Afrika-Amerika yang kalah tipis dalam pemilihan meskipun memimpin dengan nyaman dalam pemilihan.

Akhirnya, Anda sepenuhnya benar bahwa tindakan meminta pendapat seseorang dapat mengubahnya. Perusahaan polling mencoba menulis pertanyaan mereka dengan cara yang netral. Untuk menghindari masalah dengan urutan respons yang mungkin, nama kandidat mungkin dicantumkan dalam urutan acak. Beberapa versi pertanyaan juga terkadang diuji satu sama lain. Efek ini juga dapat dieksploitasi untuk tujuan jahat dalam jajak pendapat push , di mana pewawancara sebenarnya tidak tertarik untuk mengumpulkan tanggapan tetapi dalam mempengaruhi mereka. Misalnya, jajak pendapat push mungkin bertanya "Apakah Anda memilih [Calon A] bahkan jika dilaporkan bahwa ia adalah penganiaya anak-anak?".


* Anda juga dapat menetapkan target eksplisit untuk sampel Anda, seperti termasuk 500 pria dan 500 wanita. Ini disebut pengambilan sampel bertingkat - populasi dikelompokkan menjadi kelompok-kelompok yang berbeda, dan setiap kelompok kemudian dijadikan sampel secara acak. Dalam praktiknya, ini tidak sering dilakukan untuk pemungutan suara, karena Anda perlu stratifikasi menjadi banyak kelompok lengkap (misalnya, pria berpendidikan tinggi antara 18-24 di Urban Texas).

Matt Krause
sumber
2
Saya pasti mengerti mereka tidak melakukan simple random sampling, tapi pertanyaan saya adalah tentang apakah apa yang mereka sedang lakukan adalah hanya baik hanya karena terjadi bahwa asumsi mereka benar (yaitu akal tapi subjektif firasat), atau apakah asumsi juga statistik dibenarkan. Lihat komentar saya di jawaban lain di sini .
user541686
3
Keduanya, saya pikir. Membobot sampel adalah hal yang benar secara statistik untuk dilakukan, tetapi ada .... fleksibilitas dalam memutuskan bagaimana memilih faktor apa yang masuk ke dalam bobot. Misalnya, ras, jenis kelamin, dan pendidikan semuanya berguna, tetapi ternyata identifikasi partai seringkali tidak (misalnya, theguardian.com/commentisfree/2012/sep/27/… ), mungkin karena itu terkait dengan kandidat pemilih pilihan.
Matt Krause
1
Serupa dengan itu, bobot kadang-kadang termasuk perkiraan seberapa besar kemungkinan responden untuk memilih: anak muda membuat banyak suara, tetapi tidak selalu muncul; orang tua jarang menghadiri rapat umum tetapi muncul dengan andal di tempat pemungutan suara. Ini dapat diperkirakan dari data historis (daftar pemilih kadang-kadang terbuka untuk umum), tetapi saya bisa membayangkan beberapa tempat menyesuaikannya untuk orang Afrika-Amerika pada 2008 dan untuk perempuan pada 2016.
Matt Krause
Terima kasih! Mungkin baik untuk menyebutkan bahwa "fleksibilitas" dalam jawaban Anda juga :) +1
user541686
10

Ada teorema matematika yang disebut "hukum bilangan besar". Bayangkan Anda ingin menentukan probabilitas bahwa koin akan muncul. "Populasi" flip mata uang adalah tak terhingga - jauh lebih besar daripada 300.000.000 orang di Amerika Serikat. Tetapi menurut Hukum Angka Besar, semakin banyak koin yang Anda lakukan, semakin akurat perkiraan Anda.

Jajak pendapat yang ideal: Dalam jajak pendapat yang ideal, para jajak pendapat akan secara acak memilih nama-nama dari Sensus AS, mereka akan mencari tahu di mana orang-orang itu tinggal, kemudian mereka akan pergi dan mengetuk pintu mereka. Jika orang tersebut mengatakan bahwa mereka berencana untuk memilih, pemberi suara bertanya kepada siapa mereka memilih dan mencatat jawaban mereka. Polling seperti ini dijamin secara matematis untuk bekerja dan jumlah kesalahan dalam pengukuran Anda untuk tingkat kepercayaan tertentu dapat dihitung dengan mudah .

Inilah yang dimaksud dengan kesalahan: Misalkan berdasarkan jajak pendapat Anda, Anda mendapat peluang 52 persen Calon McPerfect Luar Biasa akan menang, dengan kesalahan 3% dengan kepercayaan 98%. Itu berarti bahwa Anda dapat 98% yakin bahwa bagian sebenarnya dari pemilih yang menyukai kandidat Awesome McPerfect adalah antara 49% dan 55%.

Catatan tentang Kesalahan dan Keyakinan Untuk ukuran sampel yang diberikan, semakin percaya diri Anda, semakin besar kesalahan Anda. Pikirkan tentang hal itu - Anda 100% yakin bahwa proporsi sebenarnya yang mendukung Canditate Awesome adalah antara 0% dan 100% (kemungkinan kesalahan paling banyak), dan Anda 0% yakin bahwa proporsi sebenarnya yang mendukung canditate Awesome adalah persis 52.0932840985028390984308% (nol kesalahan). Lebih percaya diri berarti lebih banyak kesalahan, kurang percaya diri berarti lebih sedikit kesalahan. Namun, hubungan antara kepercayaan dan kesalahan TIDAK linear! (Lihat: https://en.wikipedia.org/wiki/Confidence_interval )

Jajak pendapat di dunia nyata: Karena mahal untuk membuat helikopter jajak pendapat ke semua bagian negara untuk mengetuk pintu orang-orang acak (meskipun saya ingin melihat itu terjadi; jika Anda seorang miliaran dan Anda melihat ini, tolong pertimbangkan pendanaan ini), jajak pendapat di dunia nyata lebih kompleks. Mari kita lihat salah satu strategi yang lebih umum - memanggil pemilih acak dan bertanya kepada mereka siapa yang akan mereka pilih. Ini adalah strategi yang baik, tetapi memiliki beberapa kegagalan yang diketahui:

  1. Orang-orang sering memilih untuk tidak menjawab telepon dan menanggapi jajak pendapat (mis. Saya)
  2. Beberapa demografi lebih cenderung memiliki sambungan telepon rumah (mis. Pemilih yang lebih tua)
  3. Beberapa demografi lebih cenderung merespons jajak pendapat (mis. Pemilih yang lebih tua)

Karena demografi yang berbeda memberikan suara dengan cara yang berbeda, para pemberi survei harus melakukan yang terbaik untuk mengendalikan perbedaan dalam data mentah mereka (berdasarkan siapa yang memutuskan untuk menjawab telepon) dan hasil dari pemilihan yang sebenarnya. Misalnya, jika 10% orang yang mengangkat telepon adalah orang hispanik, tetapi 30% pemilih dalam pemilihan terakhir adalah orang hispanik, maka mereka akan memberi tiga kali berat kepada pemilih hispanik dalam jajak pendapat mereka. Jika 50% orang yang menjawab telepon lebih tua dari 60, tetapi hanya 30% orang yang memberikan suara dalam pemilihan terakhir lebih tua dari 60, mereka akan memberi bobot lebih sedikit kepada pemilih yang lebih tua yang merespons. Itu tidak sempurna, tetapi dapat menyebabkan beberapa prestasi prediksi yang mengesankan (Nate Silver memprediksi dengan tepat hasil di masing-masing dari 50 negara bagian dalam pemilihan 2012 menggunakan statistik,

Sebuah kata peringatan untuk orang bijak: Para pengumpul survei membuat prediksi terbaik yang bisa mereka lakukan berdasarkan bagaimana keadaan di masa lalu. Secara umum , hal-hal bekerja hampir sama sekarang seperti yang mereka lakukan di masa lalu, atau setidaknya perubahannya cukup lambat sehingga masa lalu baru-baru ini (yang paling mereka fokuskan) akan menyerupai masa kini. Namun, kadang-kadang ada pergeseran cepat dalam pemilihan dan ada yang salah. Mungkin pemilih Trump sedikit lebih kecil kemungkinannya untuk menjawab telepon daripada pemilih rata-rata Anda, dan pembobotan berdasarkan demografi tidak menjelaskan hal itu. Atau Mungkin anak muda (yang sangat mendukung Hillary) bahkan lebihtidak mungkin untuk menjawab telepon daripada yang diprediksi model, dan yang menjawab telepon lebih cenderung republik. Atau mungkin kebalikan dari keduanya itu benar - kita tidak tahu. hal-hal seperti itu adalah variabel tersembunyi yang tidak muncul dalam demografi yang biasanya dikumpulkan.

Kita akan tahu jika kita mengirim petugas survei untuk mengetuk pintu secara acak (ahem, miliar imajiner sedang membaca ini), sejak itu kita tidak perlu mempertimbangkan hal-hal berdasarkan demografi, tetapi sampai saat itu, jari-jari saling bersilangan.

J. Antonio Perez
sumber
3
Saya menghargai responsnya, tetapi ini sedikit mendasar dibandingkan dengan pertanyaan yang saya coba tanyakan dan latar belakang saya (tidak yakin apakah Anda menyadarinya, tetapi saya tidak benar-benar baru dengan dasar-dasar probabilitas / statistik); Saya tidak berpikir jawaban untuk pertanyaan saya di sini sama mendasarnya dengan pertanyaan Anda. Sebagai contoh: asumsi untuk hukum klasik jumlah besar adalah bahwa kita memiliki variabel acak dengan distribusi identik ... tapi aku gagal untuk melihat pembenaran untuk itu dalam konteks politik: mengapa harus distribusi Anda memakai suara dan Anda saya menjadi sama sekali ?
user541686
Juga, saya bahkan tidak yakin hukum jumlah besar membenarkan hal yang Anda coba benarkan bahkan jika asumsinya terpenuhi. Pertanyaannya adalah tentang ukuran sampel yang tidak ditangani oleh undang-undang dalam jumlah besar (setidaknya tidak dengan cara yang Anda sarankan); kita perlu beberapa gagasan tentang varians atau tingkat konvergensi di sini, bukan hanya konvergensi rata-rata tak terhingga. Mungkin Anda bermaksud menggunakan teorema limit pusat daripada hukum angka besar? (Meskipun tolong lihat komentar saya sebelumnya karena ini mungkin diperdebatkan.)
user541686
2
Distribusi tidak berlaku untuk suara individu. Pilihan individu tidak acak. Mereka diterapkan pada perilaku memilih populasi secara keseluruhan. Ini seperti menggambar bola berwarna dari guci - setiap bola sudah ditentukan menjadi merah atau biru, tetapi Anda dapat memiliki kemungkinan menggambar setiap warna dan sehingga Anda dapat membangun distribusi untuk kemungkinan menggambar warna bola tertentu berdasarkan sampel dari bola di guci
J. Antonio Perez
1
Mari kita melihat sesuatu selain politik dengan orang. Rasa es krim favorit seseorang tergantung pada banyak hal seperti pandangan politik mereka. Itu bisa tergantung pada preferensi teman-teman mereka, kenangan indah masa kecil mereka, pengalaman baik atau buruk di ruang tamu es krim. Mungkin mereka menyukai satu rasa karena mereka mendapatkannya pada kencan pertama mereka dengan istri atau suami mereka. Mungkin mereka tidak suka rasa karena mengingatkan mereka pada mantan mereka. Tetapi jika saya mengambil jajak pendapat acak orang-orang di Amerika, tidakkah Anda setuju bahwa saya bisa menilai rasa es krim favorit di Amerika?
J. Antonio Perez
1
"Variabel acak" adalah orang yang dipilih oleh jajak pendapat untuk ditanya preferensi mereka. Preferensi individu tidak acak; individu mana yang disurvei secara acak.
J. Antonio Perez
7

Pertama, ini terlepas dari poin utama Anda tetapi perlu disebutkan. Dalam uji coba medis Anda bisa meminta 1000 orang menguji obat yang dapat diberikan kepada 10.000 orang yang sakit setiap tahun. Anda mungkin melihat itu dan berpikir "Itu sedang diuji pada 10% dari populasi", pada kenyataannya populasinya bukan 10.000 orang, semuanya adalah pasien masa depan sehingga ukuran populasi tidak terbatas. 1000 orang tidak besar dibandingkan dengan pengguna potensial obat yang tak terbatas tetapi jenis penelitian ini bekerja. Tidak penting apakah Anda menguji 10%, 1% atau 0,1% dari populasi; yang penting adalah ukuran absolut dari sampel bukan seberapa besar dibandingkan dengan populasi.

Selanjutnya, poin utama Anda adalah bahwa ada begitu banyak variabel pengganggu yang dapat mempengaruhi pemilihan orang. Anda memperlakukan 22000 distrik di California seperti 22000 variabel tetapi sebenarnya hanya segelintir variabel (pendapatan dan pendidikan seperti yang Anda sebutkan). Anda tidak perlu sampel yang representatif dari setiap kabupaten, Anda hanya perlu sampel yang cukup untuk menutupi variasi karena pendapatan, pendidikan, dll.

kknnσ2nkkσ2n

kn

Edit:

Rumus di atas mengasumsikan bahwa setiap variabel pengganggu sama pentingnya. Jika kita ingin mempertimbangkan ratusan hal yang dapat menambah varians pada hasil maka asumsi ini tidak valid (mis. Mungkin pengguna twitter mendukung satu kandidat lebih banyak, tetapi kita tahu bahwa penggunaan twitter tidak sepenting gender).

σ20.9σ20.92σ2n=0σ20.9n=10σ2

n10σ2n0.9 dipilih secara sewenang-wenang tetapi ini menyampaikan suatu poin tentang bagaimana jumlah variabel kecil yang tak terbatas ini seharusnya bertambah hingga sesuatu yang kecil

Hugh
sumber
Terima kasih atas jawabannya! Mengenai poin pertama, saya kira itu benar, tetapi poin saya di sana adalah bahwa tidak masalah berapa ukuran populasi manusia karena Anda memiliki faktor pemaksa (DNA, dll.) Yang akan membuat hasil yang sangat mirip untuk sampel apapun. Mengenai yang kedua, meskipun: Saya dapat membeli bahwa mungkin ada beberapa variabel dalam praktek, tetapi satu-satunya cara untuk membenarkan asumsi itu secara matematis dan menggunakannya nanti adalah untuk benar-benar sampel sejumlah besar orang pertama dan menunjukkannya, kan? Tanpa itu, kesimpulannya tidak lagi tampak kuat secara statistik atau dapat dibenarkan.
user541686
Kami telah membuktikan melalui eksperimen bahwa usia, jenis kelamin, pendapatan, dan beberapa lainnya adalah faktor kunci dalam pola pemilihan orang dan kami juga mengetahui hal ini hanya dari pengetahuan umum. Anda benar bahwa mungkin ada ratusan faktor kecil lainnya yang memengaruhi suara dan secara teori mereka bisa menambah sesuatu yang signifikan tetapi pengetahuan umum kita mengatakan kepada kita bahwa mereka tidak penting. Pada titik ini model tersebut tidak dibenarkan secara ketat tetapi siapa yang akan menguji faktor-faktor kecil seperti "Apakah menjadi pirang membuat orang memilih Clinton? Apakah memakai wig membuat orang memilih Trump?".
Hugh
"tetapi siapa yang akan menguji faktor-faktor kecil seperti [...]" - tetapi itulah masalahnya di sini. Jika jawabannya adalah "karena itu yang terbaik yang bisa kita lakukan secara praktis / karena itu kebetulan bekerja / karena itu mahal / etc.", Itu jawaban yang sangat baik untuk pertanyaan "Mengapa mereka tidak melakukan polling 100.000 orang? ", tapi itu bukan jawaban untuk" Bagaimana 1.000 orang dapat dibenarkan secara statistik? ". Itu sebabnya saya menanyakan ini pada Stats.SE yang bertentangan dengan Politics.SE ... Saya tidak peduli jika lebih banyak sampel tidak praktis; pertanyaan saya adalah mengapa orang berpikir metode saat ini dibenarkan secara statistik.
user541686
Pasangan pertama dari kalimat dalam komentar terakhir tampaknya menjadi jawaban yang masuk akal meskipun, jika Anda mengatakan bahwa hal semacam studi telah dilakukan pada skala besar (~ ratusan ribu jika tidak jutaan orang) dan bahwa itu adalah dasar asumsi kami. Jika demikian, saya pikir mereka harus ditambahkan ke jawaban Anda karena mereka menjawab inti dari pertanyaan saya (idealnya dengan beberapa kutipan, meskipun saya tidak bisa terlalu pilih-pilih mengingat itu sedikit singgung dan ini bukan Politics.SE ).
user541686
Anda benar bahwa pengujian faktor-faktor kecil tidak praktis tetapi relevan secara matematis. Saya telah mengedit jawaban saya untuk memberikan alasan mengapa kami tidak khawatir tentang ratusan faktor kecil yang mempengaruhi hasil. Saya yakin Anda dapat menemukan penelitian yang dilakukan tentang pengaruh faktor utama.
Hugh