Masalah yang saya hadapi adalah memprediksi nilai deret waktu. Saya melihat satu seri waktu dan berdasarkan pada misalnya 15% dari data input, saya ingin memprediksi nilai-nilai masa depannya. Sejauh ini saya telah menemukan dua model:
Saya sudah mencoba keduanya dan membaca beberapa artikel tentang mereka. Sekarang saya mencoba untuk lebih memahami cara membandingkan keduanya. Apa yang saya temukan sejauh ini:
- LSTM bekerja lebih baik jika kita berurusan dengan sejumlah besar data dan data pelatihan yang cukup tersedia, sementara ARIMA lebih baik untuk kumpulan data yang lebih kecil (apakah ini benar?)
- ARIMA membutuhkan serangkaian parameter
(p,q,d)
yang harus dihitung berdasarkan data, sedangkan LSTM tidak memerlukan pengaturan parameter tersebut. Namun, ada beberapa hiperparameter yang perlu kita sesuaikan dengan LSTM.
Selain properti yang disebutkan di atas, saya tidak dapat menemukan poin atau fakta lain yang dapat membantu saya memilih model yang terbaik. Saya akan sangat berterima kasih jika seseorang dapat membantu saya menemukan artikel, makalah atau hal-hal lain (sejauh ini tidak beruntung, hanya beberapa pendapat umum di sana-sini dan tidak ada yang didasarkan pada eksperimen.)
Saya harus menyebutkan bahwa awalnya saya berurusan dengan data streaming, namun untuk saat ini saya menggunakan dataset NAB yang mencakup 50 dataset dengan ukuran maksimum 20k titik data.
sumber
Jawaban:
Perbandingan model jaringan syaraf tiruan dan seri waktu untuk memperkirakan harga komoditas membandingkan kinerja ANN dan ARIMA dalam memprediksi seri waktu keuangan. Saya pikir ini adalah titik awal yang baik untuk tinjauan literatur Anda.
Dalam banyak kasus, jaringan saraf cenderung mengungguli model berbasis AR. Namun, saya pikir satu kelemahan utama (yang tidak banyak dibahas dalam literatur akademis) dengan metode pembelajaran mesin yang lebih maju adalah mereka menggunakan kotak hitam. Ini adalah masalah besar jika Anda harus menjelaskan bagaimana model bekerja pada seseorang yang tidak tahu banyak dari model-model ini (misalnya dalam sebuah perusahaan). Tetapi jika Anda melakukan analisis ini hanya sebagai pekerjaan sekolah, saya tidak berpikir ini akan menjadi masalah.
Tapi seperti komentator sebelumnya katakan biasanya cara terbaik adalah dengan membentuk estimator ensemble di mana Anda menggabungkan dua atau lebih model.
sumber