Penjelasan tentang apa yang dikatakan Nate Silver tentang loess

23

Dalam sebuah pertanyaan yang saya ajukan baru-baru ini , saya diberi tahu bahwa itu adalah "tidak-tidak" yang besar untuk diekstrapolasi dengan loess. Tapi, dalam artikel terbaru Nate Silver di FiveThirtyEight.com ia membahas menggunakan loess untuk membuat prediksi pemilu.

Dia sedang mendiskusikan spesifik ramalan agresif versus konservatif dengan loess tapi saya ingin tahu validitas membuat prediksi masa depan dengan loess?

Saya juga tertarik dengan diskusi ini dan apa alternatif lain yang mungkin memiliki manfaat serupa dengan loess.

a.powell
sumber
Jika variabel-x Anda adalah waktu, akan berbahaya menggunakan loess untuk memprediksi ke masa depan (yang akan berada di luar kisaran data). Tetapi itu tidak berarti Anda tidak dapat menggunakan loess untuk membuat prediksi secara lebih umum.
Glen_b -Reinstate Monica
@Glen_b karena penasaran apa yang akan diprediksi oleh sesuatu yang "lebih umum" saya akan lakukan?
a.powell
7
Bayangkan sebuah hubungan nonlinier antara proporsi orang yang cenderung memilih partai A dan tingkat pengangguran (bersama dengan prediktor lain - efek untuk masing-masing negara misalnya). Lebih jauh bayangkan ada angka pengangguran baru saja tersedia; dalam kisaran nilai yang dialami dalam set pelatihan, tetapi tidak harus nilai yang diwakili dalam set itu (misalnya pengangguran masa lalu adalah antara 5 dan 12% dan kami sekarang memiliki angka 8,3%, diperkirakan akan stabil). Kemudian kita bisa menggunakan loess untuk memprediksi proporsi pemungutan suara A, tanpa keluar dari pengangguran 5-12%.
Glen_b -Reinstate Monica
1
@Glen_b Terima kasih. Itu adalah ilustrasi yang bagus tentang bagaimana hal itu dapat digunakan untuk perkiraan.
a.powell

Jawaban:

28

Masalah dengan lowess atau loess adalah ia menggunakan interpolasi polinomial. Sudah diketahui secara umum dalam meramalkan bahwa polinomial memiliki perilaku tidak menentu pada ekor. Ketika melakukan interpolasi, polinomial tingkat ke tiga memberikan pemodelan tren yang sangat baik dan fleksibel sementara mengekstrapolasi di luar kisaran data yang diamati, mereka meledak. Seandainya Anda mengamati data nanti dalam seri waktu, Anda pasti perlu menyertakan breakpoint lain dalam splines untuk mendapatkan kecocokan yang baik.

Model peramalan, dieksplorasi dengan baik di tempat lain dalam literatur. Proses penyaringan seperti filter Kalman dan filter partikel memberikan perkiraan yang sangat baik. Pada dasarnya, model prakiraan yang baik adalah apa saja yang didasarkan pada rantai Markov di mana waktu tidak diperlakukan sebagai parameter dalam model, tetapi keadaan model sebelumnya digunakan untuk menginformasikan prakiraan.

AdamO
sumber