Beberapa peringatan sebelum melanjutkan. Seperti yang sering saya sarankan kepada murid-murid saya, gunakan auto.arima()
hal-hal hanya sebagai perkiraan pertama untuk hasil akhir Anda atau jika Anda ingin memiliki model pelit ketika Anda memeriksa bahwa model berbasis teori saingan Anda melakukan lebih baik.
Data
Anda harus dengan jelas mulai dari deskripsi data deret waktu yang Anda gunakan. Dalam makro-ekonometrik, Anda biasanya bekerja dengan data agregat, dan rata-rata geometrik (secara mengejutkan) memiliki lebih banyak bukti empiris untuk data deret waktu makro, mungkin karena kebanyakan dari mereka terurai menjadi tren yang tumbuh secara eksponensial .
Ngomong-ngomong, saran Rob "secara visual" bekerja untuk deret waktu dengan bagian musiman yang jelas , karena data tahunan yang berubah-ubah kurang jelas untuk peningkatan variasi. Untungnya tren yang tumbuh secara eksponensial biasanya terlihat (jika tampaknya linier, daripada tidak perlu untuk log).
Model
Y( t ) = Xα11( t ) . . . Xαkk( t ) ε ( t )
Dalam log ekonometrik keuangan adalah hal yang umum karena popularitas pengembalian log, karena ...
Transformasi log memiliki sifat yang bagus
αsayaY( t )Xsaya( t )
Dalam model koreksi kesalahan kami memiliki asumsi empiris yang lebih kuat bahwa proporsi lebih stabil ( stasioner ) daripada perbedaan absolut.
Dalam ekonometrik keuangan, mudah untuk mengumpulkan pengembalian log dari waktu ke waktu .
Ada banyak alasan lain yang tidak disebutkan di sini.
Akhirnya
Perhatikan bahwa transformasi log biasanya diterapkan pada variabel non-negatif (level). Jika Anda mengamati perbedaan dua seri waktu (ekspor bersih, misalnya) bahkan tidak mungkin untuk mengambil log, Anda harus mencari data asli dalam level atau mengasumsikan bentuk tren umum yang dikurangi.
[ tambahan setelah diedit ] Jika Anda masih menginginkan kriteria statistik kapan melakukan transformasi log, solusi sederhana akan menjadi tes untuk heteroskedastisitas. Dalam hal peningkatan varian, saya akan merekomendasikan Tes Goldfeld-Quandt atau serupa dengannya. Dalam R itu terletak di library(lmtest)
dan dilambangkan dengan gqtest(y~1)
fungsi. Cukup mundur dengan istilah intersep jika Anda tidak memiliki model regresi apa pun, y
adalah variabel dependen Anda.
Plot grafik data berdasarkan waktu. Jika sepertinya variasi meningkat dengan tingkat seri, ambil log. Kalau tidak, modelkan data asli.
sumber
Dari Buahnya Kamu Harus Mengenal Mereka
Asumsinya (untuk diuji) adalah bahwa kesalahan dari model memiliki varians konstan. Catatan ini tidak berarti kesalahan dari model yang diasumsikan. Ketika Anda menggunakan analisis grafis sederhana Anda pada dasarnya mengasumsikan model linear dalam waktu.
Jadi, jika Anda memiliki model yang tidak memadai seperti yang mungkin disarankan oleh plot data yang tidak sesuai dengan waktu, Anda mungkin salah menyimpulkan tentang perlunya transformasi daya. Box dan Jenkins melakukannya dengan contoh Data Maskapai mereka. Mereka tidak memperhitungkan 3 nilai yang tidak biasa dalam data terbaru sehingga mereka secara keliru menyimpulkan bahwa ada variasi yang lebih tinggi dalam residu pada tingkat tertinggi dari seri.
Untuk informasi lebih lanjut tentang hal ini, silakan lihat http://www.autobox.com/pdfs/vegas_ibf_09a.pdf
sumber
Anda mungkin ingin log-transform seri ketika mereka entah bagaimana geometris alami atau di mana nilai waktu investasi menyiratkan bahwa Anda akan membandingkan dengan ikatan risiko minimal yang memiliki pengembalian positif. Ini akan membuat mereka lebih "linearizable", dan karenanya cocok untuk hubungan pengulangan perbedaan sederhana.
sumber