Karena pemilihan adalah acara satu kali, itu bukan percobaan yang dapat diulang. Jadi, apa tepatnya arti dari pernyataan "Hillary yang memiliki peluang 75% untuk menang" ? Saya mencari definisi yang benar secara statistik, bukan yang intuitif atau konseptual.
Saya adalah penggemar statistik amatir yang mencoba menjawab pertanyaan ini yang muncul dalam diskusi. Saya cukup yakin ada respon objektif yang baik untuk itu tetapi saya tidak bisa memunculkannya sendiri ...
probability
prediction
politics
pitosalas
sumber
sumber
Jawaban:
Semua jawaban yang diberikan sejauh ini sangat membantu, tetapi tidak terlalu tepat secara statistik, jadi saya akan coba. Pada saat yang sama, saya akan memberikan jawaban umum daripada berfokus pada pemilihan ini.
Hal pertama yang perlu diingat ketika kita mencoba menjawab pertanyaan tentang peristiwa dunia nyata seperti Clinton memenangkan pemilihan, yang bertentangan dengan masalah matematika yang dibuat-buat seperti mengeluarkan bola berbagai warna dari sebuah guci, adalah bahwa tidak ada t cara masuk akal yang unik untuk menjawab pertanyaan, dan karenanya bukan jawaban masuk akal yang unik. Jika seseorang hanya mengatakan "Hillary memiliki peluang 75% untuk menang" dan tidak melanjutkan untuk menggambarkan model pemilihan mereka, data yang mereka gunakan untuk membuat perkiraan mereka, hasil validasi model mereka, asumsi latar belakang mereka, apakah mereka Mengacu pada pemilihan umum atau pemilihan umum, dll., maka mereka belum benar-benar memberi tahu Anda apa artinya, apalagi memberikan informasi yang cukup bagi Anda untuk mengevaluasi apakah prediksi mereka bagus atau tidak. Selain itu, bukan
Jadi, apa saja prosedur yang mungkin digunakan ahli statistik untuk memperkirakan peluang Clinton? Memang, bagaimana mereka membingkai masalah? Pada tingkat tinggi, ada berbagai gagasan tentang probabilitas itu sendiri, dua yang paling penting di antaranya adalah frequentist dan Bayesian.
Dalam pandangan frequentist , probabilitas mewakili frekuensi pembatas suatu peristiwa terhadap banyak percobaan independen dari eksperimen yang sama, seperti dalam hukum jumlah besar (kuat atau lemah). Meskipun setiap pemilihan khusus adalah peristiwa yang unik, hasilnya dapat dilihat sebagai penarikan dari populasi acara yang tak terbatas baik historis dan hipotetis, yang dapat terdiri dari semua pemilihan presiden Amerika, atau semua pemilihan di seluruh dunia pada 2016, atau yang lainnya. Peluang 75% untuk kemenangan Clinton berarti bahwa jika adalah urutan hasil (0 atau 1) dari pemilihan independen yang sepenuhnya setara dengan pemilihan ini sejauh menyangkut model kami, maka rata-rata sampel konvergen dalam probabilitas menjadi 0,75 sebagaiX 1 , X 2 , ... , X n nX1,X2,… X1,X2,…,Xn n menuju tak terhingga.
Dalam pandangan Bayesian , probabilitas mewakili tingkat kepercayaan atau kredibilitas (yang mungkin atau mungkin bukan keyakinan aktual, tergantung pada apakah Anda seorang Bayesian yang subyektivis). Peluang 75% untuk kemenangan Clinton berarti 75% kredibel dia akan menang. Kredibilitas, pada gilirannya, dapat dipilih secara bebas (berdasarkan keyakinan model atau analis yang sudah ada sebelumnya) dalam batasan hukum dasar probabilitas (seperti teorema Bayes , dan fakta bahwa probabilitas peristiwa bersama tidak dapat melebihi probabilitas marginal dari salah satu dari komponen acara). Satu cara untuk meringkas undang-undang ini adalah bahwa jika Anda bertaruh pada hasil suatu pertandingan, menawarkan peluang kepada penjudi sesuai dengan kredibilitas Anda, maka tidak ada penjudi yang dapat membuat buku Belandaterhadap Anda, yaitu, serangkaian taruhan yang menjamin Anda akan kehilangan uang tidak peduli bagaimana acara itu benar-benar berjalan.
Apakah Anda mengambil pandangan frequentist atau Bayesian pada probabilitas, masih ada banyak keputusan yang harus dibuat tentang bagaimana menganalisis data dan memperkirakan probabilitas. Mungkin metode yang paling populer didasarkan pada model regresi parametrik, seperti regresi linier. Dalam pengaturan ini, analis memilih keluarga distribusi parametrik (yaitu, ukuran probabilitas ) yang diindeks oleh vektor angka yang disebut parameter. Setiap hasil adalah variabel acak independen yang diambil dari distribusi ini, ditransformasikan sesuai dengan kovariat, yang merupakan nilai yang diketahui (seperti tingkat pengangguran) yang ingin digunakan analis untuk memprediksi hasilnya. Analis memilih estimasi nilai parameter menggunakan data dan kriteria kecocokan model seperti kuadrat terkecilatau kemungkinan maksimum . Dengan menggunakan estimasi ini, model dapat menghasilkan prediksi hasil (mungkin hanya nilai tunggal, mungkin interval atau serangkaian nilai lainnya) untuk setiap nilai kovariat yang diberikan. Secara khusus, dapat memprediksi hasil pemilihan. Selain model parametrik, ada model nonparametrik (yaitu, model yang didefinisikan oleh keluarga distribusi yang diindeks dengan vektor parameter panjang tak terhingga), dan juga metode penentuan nilai prediksi yang tidak menggunakan model yang dengannya data dihasilkan sama sekali. , seperti pengklasifikasi tetangga terdekat dan hutan acak .
Menghasilkan prediksi adalah satu hal, tetapi bagaimana Anda tahu apakah itu bagus? Lagi pula, prediksi yang cukup tidak akurat lebih buruk daripada tidak berguna. Menguji prediksi adalah bagian dari praktik validasi model yang lebih besar, yaitu, mengukur seberapa baik model yang diberikan untuk tujuan tertentu. Dua metode populer untuk memvalidasi prediksi adalah validasi silang dan memecah data menjadi subset pelatihan dan pengujian sebelum memasang model apa pun. Sejauh pemilihan yang termasuk dalam data merupakan perwakilan dari pemilihan presiden AS 2016, perkiraan akurasi prediksi yang kita dapatkan dari validasi prediksi akan memberi tahu kita seberapa akurat prediksi kita tentang pemilihan presiden AS 2016.
sumber
Ketika ahli statistik ingin memprediksi hasil biner (Hillary menang vs Hillary tidak menang), mereka membayangkan bahwa alam semesta melempar koin imajiner - Kepala, Hillary menang; Ekor, dia kalah. Bagi beberapa ahli statistik, koin mewakili tingkat kepercayaan mereka pada hasil; bagi yang lain, koin itu mewakili apa yang mungkin terjadi jika kita memutar ulang pemilihan dalam keadaan yang sama berulang-ulang. Secara filosofis, sulit untuk mengetahui apa yang kita maksudkan ketika kita berbicara tentang peristiwa masa depan yang tidak pasti, bahkan sebelum kita menyeret angka ke dalamnya. Tapi kita bisa melihat dari mana nomor itu berasal.
Pada titik ini dalam pemilihan, kami memiliki urutan hasil jajak pendapat. Ini adalah bentuk: 1000 orang disurvei di, katakanlah, Ohio. 40% mendukung Trump, 39% mendukung Hillary, 21% ragu-ragu. Akan ada jajak pendapat serupa dari pemilihan sebelumnya untuk masing-masing kandidat Demokrat, Republik (dan partai jejak lainnya). Untuk tahun-tahun sebelumnya, ada juga hasil. Anda mungkin tahu bahwa, katakanlah, kandidat dengan 40% suara dalam jajak pendapat pada bulan Juli, memenangkan 8 dari 10 pemilihan sebelumnya. Atau hasilnya mungkin mengatakan, dalam 7 dari 10 pemilihan, Demokrat mengambil Ohio. Anda mungkin tahu bagaimana Ohio dibandingkan dengan Texas (mungkin mereka tidak pernah memilih kandidat yang sama) - Anda mungkin memiliki informasi tentang cara pemungutan suara yang tidak jelas - dan Anda mungkin memiliki model menarik tentang apa yang terjadi ketika seorang kandidat mulai "melonjak".
Jadi, ketika Anda mempertimbangkan pemilihan sebelumnya, Anda dapat mengatakan bahwa koin pemilihan telah dilemparkan beberapa kali. Pemilihan yang sama tidak sedang dijalankan kembali setiap 4 tahun, tetapi kita bisa berpura-pura bahwa itu adalah. Dari semua informasi ini, lembaga survei membangun model yang rumit untuk memprediksi hasilnya untuk tahun ini.
75% peluang Hillary untuk menang relatif terhadap pengetahuan kita "hari ini". Dikatakan bahwa seorang kandidat dengan jenis hasil jajak pendapat yang ia miliki "sekarang", di negara-negara yang memiliki jajak pendapat itu, dan memberikan tren dalam jajak pendapatnya selama kampanye, memenangkan pemilihan dalam 3 tahun pemilihan dari 4. Sebulan dari sekarang, kemungkinannya untuk menang akan berubah, karena modelnya akan didasarkan pada keadaan pemilihan pada bulan Agustus.
AS belum memiliki jumlah pemilu yang besar secara statistik dalam sejarahnya, apalagi sejak pemungutan suara dimulai. Kita juga tidak bisa yakin bahwa tren pemungutan suara dari, katakanlah, 70-an, masih berlaku. Jadi semuanya agak cerdik.
Intinya adalah bahwa Hillary harus mulai bekerja pada pidato pelantikannya.
sumber
Ketika ahli statistik mengatakan ini, mereka tidak mengacu pada margin kemenangan atau bagian suara. Mereka menjalankan sejumlah besar simulasi pemilihan dan menghitung berapa persentase suara yang diperoleh setiap kandidat. Untuk banyak model presidensial yang kuat, mereka memiliki prakiraan untuk setiap negara bagian. Ada yang dekat dan jika perlombaan berjalan beberapa kali, kedua kandidat bisa menang. Karena interval prediksi berkali-kali tumpang tindih dengan margin kemenangan 0, itu bukan respons biner melainkan simulasi yang akan memberi tahu kita lebih tepat apa yang diharapkan.
Halaman metodologi FiveThirtyEight dapat membantu memahami sedikit lebih dalam apa yang ada di bawah tenda: http://fivethirtyeight.com/features/a-users-guide-to-fivethirtyeights-2016-general-election-forecast/
sumber
Ada sebuah episode radio freakonomics yang sangat relevan dengan pertanyaan ini (secara umum, bukan dalam spesifikasi pemilihan umum). Di dalamnya, Stephen Dubner mewawancarai pemimpin sebuah proyek dari agen pertahanan Amerika Serikat untuk menentukan cara terbaik untuk meramalkan peristiwa politik global.
Kemudian mereka mendiskusikan apa yang tidak boleh dilakukan
Kemudian episode masuk ke metodologi yang digunakan peramal paling sukses untuk memperkirakan probabilitas ini, menganjurkan pendekatan informal Bayesian
Episode ini berjudul How To Be Less Mengerikan dalam Memprediksi Masa Depan , dan sangat menyenangkan mendengarkan. Saya mendorong Anda untuk memeriksanya jika Anda tertarik dengan hal semacam ini!
sumber
Pemilu 2016 memang merupakan acara satu kali. Tapi begitu juga dengan flip koin atau lemparan dadu.
Ketika seseorang mengklaim mereka tahu seorang kandidat memiliki peluang 75% untuk menang, mereka tidak memprediksi hasilnya. Mereka mengklaim bahwa mereka tahu bentuk mati.
Hasil pemilihan tidak dapat membatalkan ini. Tetapi jika model yang mereka gunakan untuk mencapai 75% diuji terhadap banyak pemilihan, itu bisa terbukti memiliki nilai prediksi terbatas. Atau mungkin dianggap sebagai sesuatu yang berharga.
Tentu saja, begitu seorang prediktor yang berharga diketahui oleh para kandidat, mereka dapat mengubah perilaku mereka dan modelnya dapat dibuat tidak relevan. Atau bisa meledak tidak proporsional. Lihat saja apa yang terjadi di Iowa.
sumber
Ketika seseorang mengatakan bahwa "Hillary memiliki peluang 75% untuk menang", itu berarti bahwa jika Anda menawarkan mereka taruhan di mana satu orang mendapat 25 dolar jika Hillary menang dan orang lain mendapat 75 dolar jika Hillary tidak menang, mereka akan menganggap bahwa taruhan yang adil dan tidak memiliki alasan khusus untuk memilih salah satu pihak.
Persentase ini biasanya berasal dari pasar prediksi. Ini merangkum semua informasi yang tersedia dan biasanya mengungguli metode analitik dalam memprediksi sebagian besar peristiwa.
Pasar prediksi menawarkan kesempatan kepada orang untuk bertaruh apakah acara tertentu akan terjadi atau tidak. Imbalan ditentukan oleh negosiasi antara orang-orang di kedua sisi proposisi. Umumnya, orang yang memiliki pengetahuan khusus tentang proposisi akan mencoba memanfaatkan pengetahuan itu untuk menghasilkan uang, yang memiliki efek samping bocornya informasi tersebut.
Misalnya, ada pasar prediksi apakah selebriti tertentu akan hidup sampai akhir tahun ini. Masyarakat tahu usia selebritas dan siapa pun dapat melihat probabilitas dasar bahwa selebritas akan mati pada akhir tahun. Jika hanya itu yang diketahui, Anda akan mengharapkan orang bersedia bertaruh di satu sisi atau sisi lain dari proposisi ini dengan kemungkinan yang kira-kira sama.
Sekarang, misalkan seseorang tahu bahwa selebriti dalam kesehatan yang buruk tetapi menyembunyikannya. Atau bahkan mengatakan banyak orang tahu bahwa keluarga selebriti memiliki riwayat penyakit jantung yang akan mengurangi peluang mereka untuk bertahan hidup. Orang-orang dengan informasi itu akan bersedia untuk mengambil satu sisi dari proposisi itu, menyebabkan tingkat penyesuaian seperti pembeli mendorong harga saham naik dan penjual mendorongnya ke bawah.
Dengan kata lain, ketika peluangnya terlalu rendah, orang yang mencari untung mendorong mereka. Dan ketika mereka terlalu tinggi, orang yang mencari untung mendorong mereka ke bawah. Harga taruhan pada akhirnya mencerminkan kearifan kolektif dari setiap orang tentang kemungkinan proposisi yang terjadi sebagaimana semua harga mencerminkan kearifan kolektif atas biaya dan nilai-nilai sesuatu.
sumber
Pertanyaan kuncinya adalah bagaimana Anda menetapkan probabilitas untuk peristiwa unik. Jawabannya adalah Anda mengembangkan model yang tidak lagi unik. Saya pikir contoh yang lebih mudah adalah berapa probabilitas presiden sekarat di kantor? Anda dapat melihat presiden sebagai orang dengan usia tertentu, sebagai orang dengan usia dan jenis kelamin tertentu ,. Dll ... masing-masing model memberi Anda prediksi yang berbeda ... apriori tidak ada model yang benar .. terserah ahli statistik untuk memilih model mana yang paling tepat.
sumber
Mengingat jajak pendapat menunjukkan perlombaan yang sangat ketat, 75% mungkin atau mungkin tidak akurat.
Anda bertanya apa artinya, bukan bagaimana mereka menghitung ini. Implikasinya adalah bahwa (jika kita mengabaikan orang lain kecuali Clinton dan satu lawan utamanya) bahwa Anda perlu bertaruh $ 3 untuk mendapatkan pengembalian $ 4 jika dia menang. Bergantian, taruhan $ 1 pada pelari lainnya akan menghasilkan $ 4 jika dia menang.
Jawaban saya membuat perbedaan kecil, antara peluang yang sebenarnya untuk salah satu kandidat untuk menang, dan apa yang orang (penjudi, atau peluang membuat) mengharapkan. Saya menduga bahwa ketika Anda melihat angka seperti ini, misalnya 75%, Anda melihat angka odds maker, ketika Anda melihat 49 hingga 48%, Anda melihat hasil jajak pendapat.
sumber
Jika mereka melakukannya dengan benar, sesuatu terjadi kira-kira tiga perempat dari saat-saat ketika mereka mengatakan itu memiliki peluang 75% terjadi. (atau lebih umum, ide yang sama diadaptasi pada semua perkiraan persentase)
Dimungkinkan untuk menganggap makna lebih dari itu tergantung pada pendapat filosofis kami dan seberapa banyak kami percaya pada model, tetapi sudut pandang pragmatis ini adalah sesuatu yang sama dengan penyebut umum terendah - paling tidak, metode statistik mencoba (walaupun mungkin sebagai sisi) efek daripada langsung) untuk membuat prakiraan mematuhi sudut pandang pragmatis ini.
sumber