Prediksi seri waktu menggunakan ARIMA vs LSTM

9

Masalah yang saya hadapi adalah memprediksi nilai deret waktu. Saya melihat satu seri waktu dan berdasarkan pada misalnya 15% dari data input, saya ingin memprediksi nilai-nilai masa depannya. Sejauh ini saya telah menemukan dua model:

  • LSTM (memori jangka pendek; kelas jaringan saraf berulang)
  • ARIMA

Saya sudah mencoba keduanya dan membaca beberapa artikel tentang mereka. Sekarang saya mencoba untuk lebih memahami cara membandingkan keduanya. Apa yang saya temukan sejauh ini:

  1. LSTM bekerja lebih baik jika kita berurusan dengan sejumlah besar data dan data pelatihan yang cukup tersedia, sementara ARIMA lebih baik untuk kumpulan data yang lebih kecil (apakah ini benar?)
  2. ARIMA membutuhkan serangkaian parameter (p,q,d)yang harus dihitung berdasarkan data, sedangkan LSTM tidak memerlukan pengaturan parameter tersebut. Namun, ada beberapa hiperparameter yang perlu kita sesuaikan dengan LSTM.

Selain properti yang disebutkan di atas, saya tidak dapat menemukan poin atau fakta lain yang dapat membantu saya memilih model yang terbaik. Saya akan sangat berterima kasih jika seseorang dapat membantu saya menemukan artikel, makalah atau hal-hal lain (sejauh ini tidak beruntung, hanya beberapa pendapat umum di sana-sini dan tidak ada yang didasarkan pada eksperimen.)

Saya harus menyebutkan bahwa awalnya saya berurusan dengan data streaming, namun untuk saat ini saya menggunakan dataset NAB yang mencakup 50 dataset dengan ukuran maksimum 20k titik data.

ahajib
sumber
1
Mengapa tidak Anda coba saja kedua model pada bagian data Anda, lihat mana yang lebih baik dalam peramalan, dan pilih itu. Atau gunakan kedua model dan gabungkan ramalan mereka. Kombinasi ramalan sering mengungguli perkiraan individu.
Richard Hardy
@ RichardHardy Saya sudah melakukan itu dan mengetahui kinerja mereka di dataset saya. Saya mencoba untuk mendapatkan pemahaman yang lebih baik dari keduanya, khususnya kelemahan mereka untuk melihat mana yang mungkin menjadi kandidat terbaik untuk menangani sampel data yang akan datang.
ahajib
Harap baca pusat bantuan - khususnya paragraf ketiga-terakhir yang berbunyi " Harap dicatat, bagaimanapun, bahwa lintas-posting tidak dianjurkan di situs SE. Pilih satu lokasi terbaik untuk memposting pertanyaan Anda. Kemudian, jika terbukti lebih cocok untuk situs lain, dapat dimigrasikan. "
Glen_b -Reinstate Monica

Jawaban:

2

Perbandingan model jaringan syaraf tiruan dan seri waktu untuk memperkirakan harga komoditas membandingkan kinerja ANN dan ARIMA dalam memprediksi seri waktu keuangan. Saya pikir ini adalah titik awal yang baik untuk tinjauan literatur Anda.

Dalam banyak kasus, jaringan saraf cenderung mengungguli model berbasis AR. Namun, saya pikir satu kelemahan utama (yang tidak banyak dibahas dalam literatur akademis) dengan metode pembelajaran mesin yang lebih maju adalah mereka menggunakan kotak hitam. Ini adalah masalah besar jika Anda harus menjelaskan bagaimana model bekerja pada seseorang yang tidak tahu banyak dari model-model ini (misalnya dalam sebuah perusahaan). Tetapi jika Anda melakukan analisis ini hanya sebagai pekerjaan sekolah, saya tidak berpikir ini akan menjadi masalah.

Tapi seperti komentator sebelumnya katakan biasanya cara terbaik adalah dengan membentuk estimator ensemble di mana Anda menggabungkan dua atau lebih model.

Juha
sumber
7
Referensi yang Anda sebutkan berhubungan dengan jaring saraf umpan sederhana dan terlalu tua untuk menjadi berguna (1990-an adalah seabad yang lalu). Pertanyaan OP menanyakan tentang jaringan syaraf berulang dengan arsitektur LSTM dan makalah ini tidak membahas hal itu.
horaceT
1
Seperti @horaceT menyebutkan makalah ini agak ketinggalan jaman dan jika Anda bisa menyarankan makalah yang lebih baru yang menyertakan info tentang LSTM akan luar biasa. Terima kasih
ahajib