Saya mencoba menerapkan serangkaian waktu untuk data sampel triwulanan (biomassa hewan) selama periode 10 tahun dengan 3 repetisi per kuartal. Jadi 40 tanggal tetapi 120 total pengamatan.
Saya telah membaca hingga SARIMA'a di Shumway dan Stoffer's Time Series Analysis dan Aplikasi itu serta skim Woodward, et. Analisis Rangkaian Waktu Terapan al., dan pemahaman saya adalah masing-masing model didasarkan pada pengamatan tunggal pada setiap titik dalam rangkaian waktu.
PERTANYAAN: Bagaimana saya bisa memasukkan variasi dalam setiap pengamatan dalam model saya? Saya bisa membuat seri dengan maksud, tetapi saya akan kehilangan variasi pada setiap pengamatan dan saya pikir itu penting untuk pemahaman saya tentang apa yang terjadi.
Jawaban:
Tergantung pada apa yang Anda maksud dengan "3 reps per quarter", sebuah model data panel ( wikipedia ) mungkin masuk akal. Ini berarti bahwa Anda melakukan tiga pengukuran setiap kuartal, satu dari masing-masing dari tiga sumber berbeda yang tetap sama dari waktu ke waktu. Data Anda akan terlihat seperti:
Jika ini yang Anda lihat, ada sejumlah model untuk bekerja dengan data panel. Berikut adalah presentasi yang layak yang mencakup beberapa R dasar yang akan Anda gunakan untuk melihat data panel. Dokumen ini sedikit lebih dalam, meskipun dari sudut pandang ekonometrika.
Namun, Jika data Anda tidak cukup sesuai dengan metodologi data panel, ada alat lain yang tersedia untuk "kumpulan data". Definisi dari makalah ini (pdf) :
Seperti yang Anda lihat, dari definisi itu, teknik yang akan Anda gunakan akan bergantung pada apa yang sebenarnya Anda pelajari dari data Anda.
Jika saya menyarankan tempat bagi Anda untuk memulai, dengan asumsi bahwa tiga undian Anda untuk setiap kuartal konsisten dari waktu ke waktu, saya akan mengatakan mulai dengan menggunakan estimator efek tetap (juga dikenal sebagai estimator dalam) dengan model data panel Anda data.
Untuk contoh saya di atas, kode akan terlihat seperti:
Yang memberi kami output berikut:
Di sini kita dapat dengan jelas melihat pengaruh waktu dalam koefisien pada variabel kuartal, serta efek berada di grup B, atau grup C (sebagai lawan dari grup A).
Semoga ini menunjukkan Anda di suatu tempat di arah yang benar.
sumber
Saya pikir ini menarik. Saran saya adalah untuk rata-rata tiga poin data untuk mendapatkan deret waktu yang pas. Seperti yang Anda tunjukkan jika Anda mengabaikannya karena Anda mengambil rata-rata dari tiga pengamatan Anda membuang informasi. Tetapi untuk setiap titik waktu Anda dapat menjumlahkan penyimpangan kuadrat dari mean. Gabungkan jumlah kuadrat tersebut selama semua periode waktu dan bagi dengan n-1 di mana n adalah jumlah total poin yang digunakan dalam perhitungan. Jika Anda memiliki model dengan struktur deret waktu (misalnya tren, komponen musiman, struktur ketergantungan AR) perhitungan ini bisa merupakan estimasi independen dan tidak bias dari varian istilah kesalahan dalam model.
sumber