Teknik penambangan data dalam kampanye Obama

10

Saya menemukan artikel ini tentang tim penambangan data dalam kampanye pemilihan ulang Obama. Sayangnya, artikel ini sangat kabur tentang mesin yang sebenarnya dari algoritma statistik. Namun, itu terdengar seolah-olah teknik umum dikenal dalam ilmu sosial dan politik. Karena ini bukan bidang keahlian saya, adakah yang bisa mengarahkan saya pada (ikhtisar) literatur tentang teknik semacam ini?

Fabee
sumber

Jawaban:

16

Area itu disebut microtargeting (jika Anda ingin google untuk itu). Kampanye cukup tertutup tentang alat dan prosedur mereka, sehingga untuk pengetahuan saya tidak ada yang banyak menerbitkan karya kecuali Hal Malchow ini Penargetan Politik (2008) atau Green & Gerber (2008) Keluar Vote: Cara Meningkatkan Pemilih Jumlah suara (penawaran terakhir lebih banyak dengan aspek ilmu sosial seperti iklan apa yang efektif dan semacamnya).

Pada masalah yang lebih teknis, literatur bahkan lebih langka, tetapi lihat, misalnya, Murray & Scime (2010) , makalah Analisis Politik oleh Imai & Strauss (2011) ( cetak pos ) atau makalah Annals of Applied Statistics baru-baru ini oleh kami Rusch, Lee, Hornik, Jank & Zeileis (2013) ( postprint ). Apa yang mereka semua miliki adalah bahwa mereka menggunakan teknik penambangan data, sebagian besar berbasis pohon.

Murray & Scime menggunakan pohon klasifikasi standar seperti CART.

Rusch et al. menggunakan pohon klasifikasi, model logistik dan hibrida pohon dan regresi logistik. Mereka juga menggunakan (antara lain) hutan acak, jaringan saraf, mesin vektor pendukung dan pohon Bayesian Additive Regression untuk membandingkan dengan hibrida pohon mereka, seperti yang dijelaskan dalam jawaban di atas kertas . Pohon hibrida mereka tampil setara dengan metode-metode lain pada set data mereka dan menawarkan peningkatan interpretabilitas (kami juga membagikan kode dan data mereka).

Imai & Strauss menarik sejauh mereka menyajikan kerangka teori keputusan komprehensif untuk perencanaan kampanye yang optimal, bukan hanya alat untuk penargetan mikro seperti yang lainnya. Dengan demikian mereka sangat fokus pada aspek penelitian operasional tentang bagaimana mendapatkan hasil maksimal dari setiap dolar yang dimasukkan ke dalam kampanye. Dalam aspek kerangka kerja mereka di mana mereka menggunakan teknik statistik untuk penargetan mikro dan estimasi partisipasi, mereka sekali lagi bergantung pada pohon klasifikasi.

Jadi, tampaknya ada beberapa konsensus bahwa penggunaan metode berbasis pohon bekerja dengan baik di daerah ini.

Momo
sumber