Cara yang lebih sederhana untuk menghitung Moving Average yang Diboboti Secara Eksponensial?

8

Metode yang Diusulkan:

Diberikan seri waktu xi, Saya ingin menghitung rata - rata bergerak tertimbang dengan jendela rata - rata N poin, di mana pembobotan mendukung nilai yang lebih baru daripada nilai yang lebih lama.

Dalam memilih bobot, saya menggunakan fakta yang umum bahwa deret geometri konvergen menjadi 1, yaitu (12)k, asalkan tak terhingga banyak istilah diambil.

Untuk mendapatkan jumlah bobot tertentu yang menyatukan menjadi satu, saya hanya mengambil yang pertama N ketentuan seri geometris (12)k, dan kemudian dinormalisasi dengan jumlah mereka.

Kapan N=4, misalnya, ini memberikan bobot yang tidak dinormalisasi

0.0625  0.1250  0.2500  0.5000

yang, setelah dinormalisasi dengan jumlah mereka, memberi

0.0667  0.1333  0.2667  0.5333

Rata-rata bergerak adalah jumlah produk dari 4 nilai terbaru terhadap bobot yang dinormalisasi ini.

Metode ini menggeneralisasi dengan cara yang jelas untuk memindahkan panjang jendela N, dan tampaknya komputasi juga mudah.

Pertanyaan:

Apakah ada alasan untuk tidak menggunakan cara sederhana ini untuk menghitung rata-rata bergerak tertimbang menggunakan 'bobot eksponensial'?

Saya bertanya karena entri Wikipedia untuk EWMA tampaknya lebih rumit. Yang membuat saya bertanya-tanya apakah definisi buku teks tentang EWMA mungkin memiliki beberapa sifat statistik yang tidak dimiliki definisi sederhana di atas? Atau apakah mereka sebenarnya setara?

Assad Ebrahim
sumber
Bagaimana Anda menormalkan jumlahnya? Bisakah Anda menggambarkan metode yang Anda pilih? Tidak begitu jelas dari pos. yang, setelah dinormalisasi dengan jumlah mereka, memberikan 0,0667 0,1333 0,2667 0,5333
Untuk mulai dengan Anda mengasumsikan 1) bahwa tidak ada nilai yang tidak biasa dan tidak ada perubahan level dan tidak ada tren waktu dan tidak ada boneka musiman; 2) bahwa rata-rata tertimbang optimal memiliki bobot yang jatuh pada kurva halus yang dijelaskan oleh 1 koefisien; 3) bahwa varians kesalahannya konstan; bahwa tidak ada seri penyebab yang diketahui; Kenapa semua asumsi?
IrishStat
@Ravi: Dalam contoh yang diberikan, jumlah dari empat istilah pertama adalah 0,9375 = 0,0625 + 0,125 + 0,25 + 0,5. Jadi, empat suku pertama memegang ~ 93,8% dari total berat (6,2% di ekor terpotong). Gunakan ini untuk mendapatkan bobot yang dinormalisasi yang berjumlah satu dengan menskalakan kembali (membagi) dengan 0,9375. Ini memberi 0,06667, 0,1333, 0,2667, 0,5333.
Assad Ebrahim
2
@IrishStat Sebaiknya tidak menarik orang menjauh dari situs dalam komentar atau jawaban, karena saran yang Anda berikan di luar situs bukan dengan pertanyaan dan karenanya tidak membantu pembaca di kemudian hari (mis. Lihat alasan 1. dari jawaban teratas di sini ); jika itu saran yang sesuai, biasanya harus ada di sini.
Glen_b -Reinstate Monica
1
Penjelasan terperinci dari EWMA: mathematical-modeling-python.blogspot.dk/2013/11/…
tashuhka

Jawaban:

10

Saya telah menemukan bahwa komputasi menggunakan rata-rata berjalan tertimbang secara eksponensial x¯x¯+α(xx¯), α<1 adalah

  • metode satu garis sederhana,
  • yang mudah, jika hanya kira-kira, dapat ditafsirkan dalam hal "jumlah sampel efektif" N=α1 (bandingkan formulir ini dengan formulir untuk menghitung rata-rata berjalan),
  • hanya membutuhkan datum saat ini (dan nilai rata-rata saat ini), dan
  • stabil secara numerik.

Secara teknis, pendekatan ini memasukkan semua sejarah ke dalam rata-rata. Dua keuntungan utama menggunakan jendela penuh (tidak seperti jendela terpotong yang dibahas dalam pertanyaan) adalah bahwa dalam beberapa kasus dapat memudahkan karakterisasi analitik penyaringan, dan mengurangi fluktuasi yang disebabkan jika data sangat besar (atau kecil) nilai adalah bagian dari kumpulan data. Sebagai contoh, pertimbangkan hasil filter jika semua data nol kecuali satu datum yang nilainya106.

Dave
sumber
Hai yang disana. Apakah rumus yang Anda sarankan menyertakan semua nilai sebelumnya dengan bobot yang menurun secara eksponensial? Jadi seluruh rangkaian waktu akan dimasukkan, bukan hanya yang terbaruNpoin? Mengacu padaN=4 Contoh yang diajukan dalam pertanyaan, apakah Anda menyarankan pengaturan α=0.25 atau α=0.5untuk memperkirakan rata-rata bergerak 4 poin?
Assad Ebrahim
1
Oke, itu masuk akal. Jadi tampaknya dalam kasus di mana nilai deret waktu dapat dipengaruhi oleh transien jangka pendek yang signifikan yang tidak memiliki kaitan apa pun setelah jumlah waktu tertentu telah berlalu, mungkin menguntungkan untuk menggunakan EWMA terpotong denganNdipilih untuk mencocokkan karakteristik `relevansi 'ini dari informasi historis. EWMA terpotong dalam hal ini akan mencegah a106lonjakan memiliki dampak sama sekali pada hasilnya bahkan jika itu terjadi di masa lalu, selama itu terjadi di luar wilayah relevansi informasi ... Menerima jawaban Anda - terima kasih!
Assad Ebrahim