Saya tidak mengerti apa sebenarnya perbedaan antara prediksi "in-sample" dan "out of sample"? Prakiraan dalam sampel menggunakan subset dari data yang tersedia untuk memperkirakan nilai di luar periode estimasi. Alih-alih perkiraan sampel menggunakan semua data yang tersedia Apakah ini benar ?
Secara spesifik, apakah definisi berikut ini benar?
Perkiraan sampel dalam menggunakan subset dari data yang tersedia untuk memperkirakan nilai di luar periode estimasi dan membandingkannya dengan hasil yang diketahui atau aktual yang sesuai. Ini dilakukan untuk menilai kemampuan model untuk memperkirakan nilai yang diketahui. Misalnya, perkiraan sampel dalam dari 1980 hingga 2015 mungkin menggunakan data dari 1980 hingga 2012 untuk memperkirakan model. Menggunakan model ini, peramal kemudian akan memprediksi nilai untuk 2013-2015 dan membandingkan nilai perkiraan dengan nilai aktual yang diketahui. Alih-alih perkiraan sampel menggunakan semua data yang tersedia dalam sampel untuk memperkirakan model. Untuk contoh sebelumnya, estimasi akan dilakukan selama 1980-2015, dan perkiraan akan dimulai pada 2016.
sumber
Jawaban:
Dengan "sampel" itu berarti sampel data yang Anda gunakan agar sesuai dengan model.
Pertama - Anda memiliki sampel
Kedua - Anda cocok dengan model pada sampel
Ketiga - Anda dapat menggunakan model untuk perkiraan
Jika Anda memperkirakan untuk pengamatan yang merupakan bagian dari sampel data - itu adalah perkiraan dalam sampel.
Jika Anda memperkirakan untuk pengamatan yang bukan bagian dari sampel data - itu adalah perkiraan out-of-sample.
Jadi pertanyaan yang harus Anda tanyakan pada diri sendiri adalah: Apakah pengamatan khusus yang digunakan untuk model cocok atau tidak? Jika digunakan untuk pemasangan model, maka perkiraan pengamatan adalah dalam-sampel. Kalau tidak, itu out-of-sample.
sumber
Misalkan dalam sampel Anda, Anda memiliki urutan 10 titik data. Data ini dapat dibagi menjadi dua bagian - misalnya 7 titik data pertama untuk memperkirakan parameter model dan 3 titik data berikutnya untuk menguji kinerja model. Dengan menggunakan model yang sesuai, prediksi yang dibuat untuk 7 titik data pertama akan disebut prakiraan sampel dalam dan yang sama untuk 3 poin data terakhir akan dipanggil di luar perkiraan sampel. Ini sama dengan gagasan untuk membagi data ke dalam set pelatihan dan set validasi.
sumber
Prakiraan dalam sampel adalah proses evaluasi formal kemampuan prediksi model yang dikembangkan menggunakan data yang diamati untuk melihat seberapa efektif algoritma dalam mereproduksi data. Ini agak mirip dengan set pelatihan dalam algoritma pembelajaran mesin dan out-of-sample mirip dengan set tes.
sumber
Diagram di bawah ini akan membantu Anda memahami IN TIME dan OUT OF TIME
sumber
Dalam Perkiraan Rangkaian waktu, 'Sampel' berarti data kereta 'Sampel luar' berarti data uji
Dalam seri Time, pertama-tama kita dapat memperkirakan hasil untuk data 'Insample' (yaitu kereta). Nanti kita dapat memperkirakan hasil untuk data 'uji coba' (yaitu pengujian).
sumber