Saya mencoba mempelajari cara menggunakan Neural Networks. Saya sedang membaca tutorial ini .
Setelah memasang Neural Network pada Time Series menggunakan nilai pada untuk memprediksi nilai pada t + 1 penulis memperoleh plot berikut, di mana garis biru adalah seri waktu, hijau adalah prediksi pada data kereta, merah adalah prediksi pada data uji (ia menggunakan tes-kereta split)
dan menyebutnya "Kita bisa melihat bahwa model melakukan pekerjaan yang sangat buruk untuk menyesuaikan baik pelatihan dan dataset uji. Pada dasarnya memperkirakan nilai input yang sama dengan output."
dan mengatakan "Melihat grafik, kita dapat melihat lebih banyak struktur dalam prediksi."
Pertanyaan saya
Mengapa "miskin" pertama? itu terlihat hampir sempurna bagiku, ia memprediksi setiap perubahan dengan sempurna!
Dan juga, mengapa yang kedua lebih baik? Di mana "struktur" itu? Bagi saya itu tampak jauh lebih miskin daripada yang pertama.
Secara umum, kapan prediksi tentang deret waktu baik dan kapan itu buruk?
sumber
Jawaban:
Ini semacam ilusi optik: mata melihat grafik, dan melihat bahwa grafik merah dan biru tepat di sebelah masing-masing. Masalahnya adalah mereka berada tepat di sebelah satu sama lain secara horizontal , tetapi yang penting adalah vertikaljarak. Mata paling mudah melihat jarak antara kurva dalam ruang dua dimensi dari grafik Cartesian, tetapi yang penting adalah jarak satu dimensi dalam nilai t tertentu. Sebagai contoh, misalkan kita memiliki poin A1 = (10.100), A2 = (10.1, 90), A3 = (9.8.85), P1 = (10.1.100.1), dan P2 = (9.8, 88). Mata secara alami akan membandingkan P1 dengan A1, karena itu adalah titik terdekat, sedangkan P2 akan dibandingkan dengan A2. Karena P1 lebih dekat ke A1 daripada P2 ke A3, P1 akan terlihat seperti prediksi yang lebih baik. Tetapi ketika Anda membandingkan P1 dengan A1, Anda hanya melihat seberapa baik A1 mampu mengulangi apa yang dilihatnya sebelumnya; sehubungan dengan A1, P1 bukan prediksi. Perbandingan yang tepat adalah antara P1 v. A2, dan P2 v. A3, dan dalam perbandingan ini P2 lebih baik daripada P1. Akan lebih jelas jika, selain memplot y_actual dan y_pred terhadap t, sudah ada grafik (y_pred-y_actual) terhadap t.
sumber
Ini adalah ramalan yang disebut "bergeser". Jika Anda melihat lebih dekat pada grafik 1, Anda melihat bahwa kekuatan prediksi hanya dalam menyalin hampir persis nilai terakhir yang terlihat. Itu berarti model tidak belajar yang lebih baik, dan itu memperlakukan deret waktu sebagai jalan acak. Saya kira masalahnya mungkin karena Anda menggunakan data mentah yang Anda berikan ke jaringan saraf. Data-data ini tidak stasioner yang menyebabkan semua masalah.
sumber