Saat ini saya sedang mengerjakan beberapa data deret waktu, saya tahu saya bisa menggunakan model LOESS / ARIMA.
Data ditulis ke vektor yang panjangnya 1000, yang merupakan antrian, diperbarui setiap 15 menit,
Dengan demikian data lama akan muncul sementara data baru mendorong dalam vektor.
Saya dapat menjalankan kembali seluruh model pada penjadwal, misalnya melatih ulang model setiap 15 menit, yaitu, Gunakan seluruh nilai 1000 untuk melatih model LOESS, Namun sangat tidak efisien, karena setiap kali hanya satu nilai yang disisipkan sementara 999 vlaues lainnya masih sama seperti terakhir kali.
Jadi bagaimana saya bisa mencapai kinerja yang lebih baik?
Terimakasih banyak
Jawaban:
Biarkan saya merumuskan kembali ini menjadi sesuatu yang lebih akrab bagi saya. ARIMA adalah pendekatan analog ke PID. Saya tidak terpisahkan. MA adalah P. AR dapat dinyatakan sebagai persamaan perbedaan yang merupakan istilah D. LOESS adalah analog ke kuadrat pas (benar-benar kakak teknologi tinggi).
Jadi jika saya ingin meningkatkan model urutan kedua (PID) apa yang bisa dilakukan?
Salah satu pertanyaan yang gagal saya tanyakan adalah "apa arti kinerja?". Jika kita tidak memiliki ukuran kebaikan yang dinyatakan dengan jelas maka tidak ada cara untuk mengetahui apakah metode kandidat "membaik". Sepertinya Anda menginginkan pemodelan yang lebih baik, waktu komputasi yang lebih singkat, dan penggunaan informasi yang lebih efisien. Memiliki ephemeris tentang data aktual juga dapat menginformasikan hal ini. Jika Anda memodelkan angin, maka Anda bisa tahu di mana harus mencari model augmentasi, atau menemukan transformasi untuk data Anda yang berguna.
sumber
Ini adalah pertanyaan yang berbeda tergantung pada apakah Anda menggunakan loess atau model ARIMA. Saya akan menjawab hanya pertanyaan loess untuk saat ini, karena saya menduga ada sedikit efisiensi yang mungkin dalam kasus ARIMA selain mungkin memiliki nilai awal yang baik.
Model loess bekerja dengan mencocokkan regresi tertimbang ke himpunan bagian data yang berbeda. Hanya sebagian data yang digunakan untuk setiap kecocokan. Jadi setiap kali Anda mereparasi model yang telah menurunkan satu titik data di satu ujung dan menambahkan yang lain di ujung yang berlawanan, Anda secara teknis hanya perlu menyesuaikan dengan regresi lokal yang menggunakan titik pertama dan terakhir. Semua regresi lokal di antara keduanya akan sama. Tepatnya berapa banyak dari regresi lokal yang tidak terpengaruh ini yang akan tergantung pada parameter smoothing Anda di loess.
Anda dapat meretas paket apa pun yang Anda gunakan agar sesuai dengan model Anda sehingga dapat mengambil sebagian besar regresi lokal dari kecocokan sebelumnya, dan hanya cocok dengan yang dibutuhkan pada awal dan akhir data.
Namun, bagi saya ini hanya layak dilakukan jika biaya dalam waktu pemrograman tambahan secara material lebih kecil daripada biaya waktu komputer untuk menyesuaikan model dari awal setiap 15 menit. Dengan hanya 1000 titik data tentu bukan hal yang besar untuk menyesuaikan model dari awal setiap kali.
sumber