Saya benar-benar baru dalam statistik dan bidang interval kepercayaan. Jadi ini mungkin sangat sepele atau bahkan terdengar bodoh. Saya akan sangat menghargai jika Anda dapat membantu saya memahami atau mengarahkan saya ke beberapa literatur / teks / blog yang menjelaskan hal ini dengan lebih baik.
Saya melihat di berbagai situs berita seperti CNN, berita Fox, Politico dll tentang jajak pendapat mereka mengenai pemilihan Presiden AS 2012. Setiap lembaga melakukan beberapa jajak pendapat dan melaporkan beberapa statistik dari formulir:
CNN: Popularitas Obama adalah X% dengan margin kesalahan +/- x1%. Ukuran sampel 600. FOX: Popularitas Obama adalah Y% dengan margin kesalahan +/- y1%. Ukuran sampel 800. XYZ: Popularitas Obama adalah Z% dengan margin kesalahan +/- z1%. Ukuran sampel 300.
Inilah keraguan saya:
Bagaimana saya memutuskan yang mana yang akan dipercaya? Haruskah itu didasarkan pada interval kepercayaan, atau haruskah saya berasumsi bahwa karena Fox memiliki ukuran sampel yang lebih besar, perkiraannya lebih dapat diandalkan? Apakah ada hubungan implisit antara kepercayaan dan ukuran sampel sehingga menentukan satu meniadakan kebutuhan untuk menentukan yang lain?
Bisakah saya menentukan standar deviasi dari interval kepercayaan? Jika demikian, apakah valid selalu atau hanya valid untuk distribusi tertentu (seperti Gaussian)?
Adakah cara saya bisa "menggabungkan" atau "menggabungkan" ketiga estimasi di atas dan mendapatkan estimasi saya sendiri bersama dengan interval kepercayaan? Berapa ukuran sampel yang harus saya klaim dalam kasus itu?
Saya telah menyebutkan CNN / Fox hanya untuk lebih menjelaskan contoh saya. Saya tidak punya niat untuk memulai debat Demokrat vs Republikan di sini.
Tolong bantu saya memahami masalah yang saya angkat.
Ini adalah topik besar, tetapi pada dasarnya ada dua masalah:
1) Presisi - ini ditentukan oleh ukuran sampel. Sampel yang lebih besar memberikan perkiraan yang lebih tepat dengan kesalahan standar yang lebih rendah dan interval kepercayaan yang lebih ketat
2) Bias - yang, dalam statistik, tidak selalu memiliki konotasi negatif seperti di tempat lain. Dalam jajak pendapat, mereka mencoba untuk mendapatkan sampel acak XXXX (kadang-kadang pemilih kemungkinan, kadang pemilih terdaftar). Tetapi, mereka tidak melakukannya. Beberapa jajak pendapat hanya menggunakan garis tanah. Kelompok orang yang berbeda cenderung menjawab. Kelompok yang berbeda lebih atau kurang cenderung untuk menutup telepon.
Jadi, semua lembaga survei mempertimbangkan tanggapan mereka. Artinya, mereka mencoba menyesuaikan hasil mereka untuk mencocokkan fakta yang diketahui tentang pemilih. Tetapi mereka semua melakukannya sedikit berbeda. Jadi, bahkan dengan input data polling yang sama, mereka akan memberikan angka yang berbeda.
Siapa yang harus dipercaya? Nah, jika Anda melihat karya Nate Silver pada 538, ia memiliki peringkat seberapa akurat jajak pendapat dalam pemilihan sebelumnya. Tapi itu tidak berarti mereka akan sama akuratnya sekarang.
sumber
Ini termasuk dalam area sampling survei. Pada prinsipnya metode ini bekerja karena pengacakan digunakan. Berikut adalah hal-hal yang dapat berbeda dalam jajak pendapat berdasarkan keputusan subyektif.
Bingkai pengambilan sampel. Dari kelompok pemilih manakah saya harus mengambil sampel?
Bagaimana cara saya menangani volatilitas pemilih yang tidak dapat memutuskan yang dapat mengubah pendapatnya tentang Obama vs Romney berdasarkan jajak pendapat kemarin atau minggu-minggu mendatang?
Peter menyentuh bias. Jajak pendapat intisari sastra tahun 1936 adalah bencana. Ini memilih kandidat Republik dari FDR karena kerangka pengambilan sampel didasarkan pada pemilihan acak nomor telepon. Pada tahun 1936 hanya kelas menengah ke atas dan orang kaya yang memiliki telepon. Kelompok itu didominasi oleh Partai Republik yang cenderung memilih kandidat Partai Republik. Roosevelt dimenangkan oleh tanah longsor yang mendapatkan suaranya dari yang miskin dan kelas menengah yang cenderung sangat banyak dari kelompok Demokrat! Itu menggambarkan bias karena pilihan kerangka sampling yang buruk.
Survei pengambilan sampel berkaitan dengan populasi terbatas. Ukuran populasi adalah N. Katakanlah sampel acak sederhana diambil dari populasi itu dan memiliki ukuran n. Untuk kesederhanaan anggaplah hanya Obama dan Romney yang berjalan. Proporsi suara yang Obama dapatkan untuk kerangka pengambilan sampel ini adalah rata-rata variabel biner (katakan 1 jika responden memilih Obama dan 0 untuk Romney). Varian dari mean sampel untuk variabel ini adalah [p (1-p) / n] [Nn] / N di mana p adalah proporsi populasi sebenarnya yang akan memilih Obama. [Nn] / N adalah koreksi populasi terbatas. dalam kebanyakan jajak pendapat, N jauh lebih besar dari N dan yang benar dapat diabaikan. Melihat p (1-p) / n kita melihat varians turun dengan n. Jadi, jika n besar interval kepercayaan pada tingkat kepercayaan tertentu akan menjadi kecil.
Petugas survei sampler dan ahli statistik survei lainnya di Biro Sensus AS semuanya memiliki alat statistik ini dan mereka melakukan metode yang lebih kompleks dan akurat (sampel acak cluster dan stratified random sampling untuk menyebutkan beberapa metode).
Ketika asumsi pemodelan mereka valid, metode ini bekerja dengan sangat baik. Keluar dari polling adalah contoh utama. Pada hari pemilihan Anda akan melihat jaringan yang secara akurat memproyeksikan pemenang di hampir setiap negara jauh sebelum penghitungan akhir. Itu karena variabilitas hari pemilihan telah hilang. Mereka tahu secara historis bagaimana orang cenderung memilih dan mereka dapat menentukan daerah yang dipilih dengan cara yang menghindari bias. Jaringan kadang berbeda. Ini bisa disebabkan oleh kompetisi untuk memilih pemenang di depan mental orang lain. Dalam kasus yang jarang juga bisa terjadi karena pemungutan suara sangat dekat (misalnya Pemilihan Presiden 2000 di Florida).
Saya harap ini memberi Anda gambaran yang lebih jelas tentang apa yang terjadi. Kita tidak lagi melihat kesalahan besar seperti "Dewey mengalahkan Truman" pada tahun 1948 atau kegagalan Literary Digest tahun 1936. Tetapi statistik tidak sempurna dan ahli statistik tidak pernah bisa mengatakan bahwa mereka yakin.
sumber