Hanya pertanyaan umum. Jika Anda memiliki data deret waktu, kapankah lebih baik menggunakan teknik deret waktu (alias, ARCH, GARCH, dll.) Di atas teknik pembelajaran mesin / statistik (KNN, regresi)? Jika ada pertanyaan serupa yang ada di crossvalidated, tunjukkan saya ke arah itu - tampak dan tidak dapat menemukannya.
10
Jawaban:
Metode pembelajaran mesin umum mengasumsikan bahwa data Anda independen dan terdistribusi secara identik, yang tidak berlaku untuk data deret waktu. Oleh karena itu mereka berada pada posisi yang kurang menguntungkan dibandingkan dengan teknik deret waktu, dalam hal akurasi. Untuk contoh-contoh ini, lihat pertanyaan-pertanyaan sebelumnya. Mengurutkan deret waktu untuk pembelajaran mesin dan Random forest overfitting .
sumber
Francis Diebold baru-baru ini memposting "ML dan Metrik VI: Perbedaan Utama Antara ML dan Ekonometrika TS" di blog-nya. Saya menyediakan versi singkatnya, jadi semua kredit diberikan kepadanya. (Penekanan dalam huruf tebal adalah milikku.)
Jadi kesimpulannya adalah:
Saya sarankan membaca seluruh posting asli di sini .
sumber
Seperti @Tom Minka menunjukkan sebagian besar teknik ML menganggap input iid. Ada beberapa solusi:
Seseorang dapat menggunakan semua sampel deret waktu lampau dalam sistem 'Memori' sebagai satu vektor fitur, yaitu: x = [x (t-1), x (t-2), ... x (tM)]. Namun, ini memiliki 2 masalah: 1) tergantung pada binning Anda, Anda mungkin memiliki vektor fitur yang besar 2- beberapa metode memerlukan fitur dalam vektor fitur menjadi independen, yang tidak terjadi di sini.
Ada banyak teknik ML yang dirancang khusus untuk data deret waktu tersebut, misalnya Hidden Markov Models, yang telah digunakan dengan sangat sukses untuk deteksi kejang, pemrosesan suara, dll ...
Akhirnya, pendekatan yang saya ambil adalah menggunakan teknik 'ekstraksi fitur' untuk mengubah masalah regresi dinamis (yang memiliki elemen waktu) menjadi masalah statis. Misalnya, pendekatan Principal Dynamics Mode (PDM) memetakan vektor fitur masa lalu input ([x (t-1), x (t-2), ... x (tM)]) ke yang statis ([v ( 1), v (2), .. v (L)]) dengan menggabungkan masa lalu dengan bank filter linier khusus sistem (PDM), lihat Marmarelis, 2004 buku atau Marmarelis, Vasilis Z. "Metodologi pemodelan untuk sistem fisiologis nonlinear . " Annals of biomedical engineering 25.2 (1997): 239-251 ...
sumber