Saya memiliki beberapa data frekuensi kumulatif. Garis sepertinya cocok dengan data dengan sangat baik, tetapi ada goyangan siklik / periodik di baris. Saya ingin memperkirakan kapan frekuensi kumulatif akan mencapai nilai tertentu c . Ketika saya memetakan nilai residu vs pas, saya mendapatkan perilaku sinusoidal yang indah.
Sekarang, untuk menambahkan komplikasi lain, perhatikan bahwa dalam plot residual
ada dua siklus yang memiliki nilai lebih rendah dari yang lain, yang mewakili efek akhir pekan yang juga harus diperhitungkan.
Jadi, kemana saya harus pergi dari sini? Bagaimana saya bisa menggabungkan beberapa istilah cosinus, sinus, atau siklik ke dalam model regresi untuk kira-kira. memperkirakan kapan frekuensi kumulatif akan sama dengan ?
sumber
Mari kita mulai dengan mengamati bahwa kuadrat terkecil yang cocok untuk data ini kemungkinan tidak tepat. Jika data individu yang terakumulasi diasumsikan, seperti biasa, memiliki komponen acak kesalahan, maka kesalahan dalam data kumulatif ( bukan yang frekuensi kumulatif -yang ini sesuatu yang berbeda dari apa yang Anda miliki) adalah jumlah kumulatif dari semua istilah kesalahan. Ini membuat data kumulatif heteroscedastic (mereka menjadi lebih dan lebih bervariasi dari waktu ke waktu) dan berkorelasi positif. Karena data ini berperilaku sangat teratur, dan ada banyak dari mereka, ada sedikit masalah dengan kecocokan Anda akan mendapatkan, tetapi perkiraan kesalahan Anda, prediksi Anda (yang merupakan inti dari pertanyaan itu), dan terutama kesalahan prediksi standar Anda bisa jadi jauh.
Prosedur standar untuk menganalisis data tersebut dimulai dengan nilai asli. Ambil perbedaan sehari-hari untuk menghilangkan komponen sinusoidal frekuensi tinggi. Ambil perbedaan mingguan dari mereka untuk menghapus kemungkinan siklus minggu-ke-minggu. Analisis apa yang tersisa. Pemodelan ARIMA adalah pendekatan fleksibel yang kuat, tetapi mulailah secara sederhana: buat grafik data yang berbeda untuk melihat apa yang terjadi, kemudian beralih dari sana. Perhatikan juga, bahwa dengan data kurang dari dua minggu perkiraan Anda tentang siklus mingguan akan buruk dan ketidakpastian ini akan mendominasi ketidakpastian dalam prediksi.
sumber
Jelas osilasi dominan memiliki periode satu hari. Sepertinya ada juga komponen frekuensi rendah yang berkaitan dengan hari dalam seminggu, jadi tambahkan komponen dengan frekuensi satu minggu (yaitu satu-tujuh dari sehari) dan beberapa harmonik pertamanya. Itu memberikan model bentuk:
sumber
Mengapa tidak hanya menggunakan GA untuk menemukan amplitudo, periode, dan fase dari seri Sine (atau cosinus) secara berurutan, kemudian digabungkan. Optimalkan yang berikut: (n (n-1) / ((np-1) ^ 2 (np-2))) RSS
sumber