Saya memiliki serangkaian pengukuran waktu (seri ketinggian-satu dimensi). Pada periode pengamatan, proses pengukuran turun untuk beberapa titik waktu. Jadi data yang dihasilkan adalah vektor dengan NaNs di mana ada kesenjangan dalam data. Menggunakan MATLAB, ini menyebabkan saya masalah ketika menghitung autokorelasi ( autocorr
) dan menerapkan jaringan saraf ( nnstart
).
Bagaimana cara mengatasi Kesenjangan ini? Haruskah saya menghapus ini dari vektor? Atau ganti entri mereka dengan nilai interpolasi? (jika demikian bagaimana di MATLAB)
Ada beberapa algoritma yang kebal terhadap nilai yang hilang, jadi solusi yang lebih disukai adalah mencarinya (misalnya R
acf
untuk autokorelasi).Secara umum, cara untuk pergi adalah dengan hanya membuang data dengan pengamatan yang hilang (mungkin sangat menyakitkan) atau hanya untuk menyalahkan nilai-nilai mereka - rata-rata tetangga mungkin cukup untuk seri halus dan kesenjangan kecil, tetapi ada tentu saja kebanyakan metode lain yang lebih kuat, menggunakan splines, nilai acak / paling sering, imputasi dari model, dll.
sumber
Gunakan Deteksi Intervensi untuk menyalahkan katup yang hilang yang mengeksploitasi struktur ARIMA yang berguna dan setiap tren waktu setempat dan / atau pergeseran level.
sumber
ada 2 masalah di sini. yang pertama adalah menyediakan kerangka numerik yang bermakna untuk jawaban autokorelasi Anda di matlab. Agar hal ini terjadi, Anda perlu meregangkan dan / atau menambal bagian rangkaian waktu dari vektor data Anda ... komponen 'integritas data' dari masalah ini adalah yang paling mendasar.
kedua, Anda perlu memutuskan bagaimana menangani komponen 'nilai' dari vektor Anda ... ini sangat tergantung pada aplikasi tertentu seperti apa yang paling baik untuk diasumsikan, (misalnya, kecil, perangko waktu yang hilang dan NaN yang sesuai atau Nulls dapat diinterpolasi dengan aman dari tetangganya ... di celah yang lebih besar, menetapkan nilai ke nol mungkin lebih aman ... atau menyalahkan seperti yang disarankan di atas - jelas agar ini bermakna, kesenjangan lagi harus relatif kecil.) .
sumber