Setelah membaca salah satu "Tip penelitian" RJ Hyndman tentang validasi silang dan rangkaian waktu, saya kembali ke pertanyaan lama saya yang akan saya coba rumuskan di sini. Idenya adalah bahwa dalam masalah klasifikasi atau regresi, pemesanan data tidak penting, dan karenanya k- lipatan validasi silang dapat digunakan. Di sisi lain, dalam deret waktu, pemesanan data jelas sangat penting.
Namun, bila menggunakan model mesin seri waktu perkiraan belajar, strategi umum adalah untuk membentuk kembali seri ke dalam satu set "input-output vektor" yang, untuk waktu t , memiliki bentuk ( y t - n + 1 , . . . , Y t - 1 , y t ; y t + 1 ) .
Sekarang, setelah pembentukan kembali ini telah dilakukan, dapatkah kita mempertimbangkan bahwa set "vektor input-output" yang dihasilkan tidak perlu dipesan? Jika kita menggunakan, misalnya, jaringan saraf umpan-maju dengan n input untuk "mempelajari" data ini, kita akan mencapai hasil yang sama tidak peduli urutan di mana kita menunjukkan vektor ke model. Dan oleh karena itu, dapatkah kita menggunakan validasi silang k-fold dengan cara standar, tanpa perlu menyesuaikan model setiap kali?