Perkirakan koefisien ARMA melalui inspeksi ACF dan PACF

16

Bagaimana Anda memperkirakan model ramalan yang sesuai untuk serangkaian waktu dengan inspeksi visual plot ACF dan PACF? Yang mana (yaitu, ACF atau PACF) memberi tahu AR atau MA (atau keduanya)? Bagian mana dari grafik yang memberi tahu Anda bagian musiman dan non-musiman untuk ARIMA musiman?

Pertimbangkan fungsi ACF dan PCF yang ditampilkan di bawah ini. Mereka berasal dari serangkaian transformasi log yang telah dibedakan dua kali, satu perbedaan sederhana dan satu musiman ( data asli , data transformasi log ). Bagaimana Anda mengkarakterisasi seri? Model apa yang paling cocok untuk itu?

masukkan deskripsi gambar di sini

4 belajar
sumber

Jawaban:

12

Jawaban saya sebenarnya adalah ringkasan dari javlacelle tetapi terlalu panjang untuk sebuah komentar sederhana tetapi tidak terlalu pendek untuk menjadi tidak berguna.

Walaupun respons jvlacelle secara teknis benar pada satu tingkat, ia "terlalu menyederhanakan" karena menempatkan "hal-hal" tertentu yang biasanya tidak pernah benar. Ini mengasumsikan bahwa tidak ada struktur deterministik yang diperlukan seperti satu atau lebih tren waktu ATAU satu atau lebih pergeseran level atau satu atau lebih pulsa musiman atau satu atau lebih pulsa satu kali. Lebih jauh lagi, diasumsikan bahwa parameter dari model yang diidentifikasi adalah invarian dari waktu ke waktu dan proses kesalahan yang mendasari model tentatif diidentifikasi juga invarian dari waktu ke waktu. Mengabaikan salah satu di atas sering (selalu menurut saya!) Resep untuk bencana atau lebih tepatnya "model yang diidentifikasi dengan buruk". Kasus klasik dari hal ini adalah transformasi logaritmik yang tidak perlu diusulkan untuk seri maskapai dan untuk seri yang disajikan OP dalam pertanyaan yang direvisi. Tidak ada kebutuhan untuk transformasi logaritmik untuk datanya karena hanya ada beberapa nilai "tidak biasa" pada periode 198.207.218.219 dan 256 yang tidak ditangani menciptakan kesan yang salah bahwa ada varians kesalahan yang lebih tinggi dengan level yang lebih tinggi. Perhatikan bahwa "nilai-nilai yang tidak biasa" diidentifikasi dengan mempertimbangkan setiap struktur ARIMA yang diperlukan yang sering luput dari mata manusia. Transformasi diperlukan ketika varians kesalahan tidak konstan dari waktu ke waktu TIDAK ketika varians dari Y yang diamati tidak konstan dari waktu ke waktu. . Prosedur primitif masih membuat kesalahan taktis dalam memilih transformasi sebelum waktunya sebelum pengobatan yang disebutkan di atas. Kita harus ingat bahwa strategi identifikasi model ARIMA yang sederhana dikembangkan pada awal tahun 60-an TETAPI banyak perkembangan / peningkatan yang telah terjadi sejak saat itu. 219 dan 256 yang tidak diobati menciptakan kesan salah bahwa ada varians kesalahan yang lebih tinggi dengan tingkat yang lebih tinggi. Perhatikan bahwa "nilai-nilai yang tidak biasa" diidentifikasi dengan mempertimbangkan setiap struktur ARIMA yang diperlukan yang sering luput dari mata manusia. Transformasi diperlukan ketika varians kesalahan tidak konstan dari waktu ke waktu TIDAK ketika varians dari Y yang diamati tidak konstan sepanjang waktu . Prosedur primitif masih membuat kesalahan taktis dalam memilih transformasi sebelum waktunya sebelum pengobatan yang disebutkan di atas. Kita harus ingat bahwa strategi identifikasi model ARIMA yang sederhana dikembangkan pada awal tahun 60-an TETAPI banyak perkembangan / peningkatan yang telah terjadi sejak saat itu. 219 dan 256 yang tidak diobati menciptakan kesan salah bahwa ada varians kesalahan yang lebih tinggi dengan tingkat yang lebih tinggi. Perhatikan bahwa "nilai-nilai yang tidak biasa" diidentifikasi dengan mempertimbangkan setiap struktur ARIMA yang diperlukan yang sering luput dari mata manusia. Transformasi diperlukan ketika varians kesalahan tidak konstan dari waktu ke waktu TIDAK ketika varians dari Y yang diamati tidak konstan sepanjang waktu . Prosedur primitif masih membuat kesalahan taktis dalam memilih transformasi sebelum waktunya sebelum pengobatan yang disebutkan di atas. Kita harus ingat bahwa strategi identifikasi model ARIMA yang sederhana dikembangkan pada awal tahun 60-an TETAPI banyak perkembangan / peningkatan yang telah terjadi sejak saat itu. diidentifikasi dengan mempertimbangkan setiap struktur ARIMA yang diperlukan yang sering keluar dari mata manusia. Transformasi diperlukan ketika varians kesalahan tidak konstan dari waktu ke waktu TIDAK ketika varians dari Y yang diamati tidak konstan dari waktu ke waktu. Prosedur primitif masih membuat kesalahan taktis dalam memilih transformasi sebelum waktunya sebelum pengobatan yang disebutkan di atas. Kita harus ingat bahwa strategi identifikasi model ARIMA yang sederhana dikembangkan pada awal tahun 60-an TETAPI banyak perkembangan / peningkatan yang telah terjadi sejak saat itu. diidentifikasi dengan mempertimbangkan setiap struktur ARIMA yang diperlukan yang sering keluar dari mata manusia. Transformasi diperlukan ketika varians kesalahan tidak konstan dari waktu ke waktu TIDAK ketika varians dari Y yang diamati tidak konstan dari waktu ke waktu. Prosedur primitif masih membuat kesalahan taktis dalam memilih transformasi sebelum waktunya sebelum pengobatan yang disebutkan di atas. Kita harus ingat bahwa strategi identifikasi model ARIMA yang sederhana dikembangkan pada awal tahun 60-an TETAPI banyak perkembangan / peningkatan yang telah terjadi sejak saat itu. Prosedur primitif masih membuat kesalahan taktis dalam memilih transformasi sebelum waktunya sebelum pengobatan yang disebutkan di atas. Kita harus ingat bahwa strategi identifikasi model ARIMA yang sederhana dikembangkan pada awal tahun 60-an TETAPI banyak perkembangan / peningkatan yang telah terjadi sejak saat itu. Prosedur primitif masih membuat kesalahan taktis dalam memilih transformasi sebelum waktunya sebelum pengobatan yang disebutkan di atas. Kita harus ingat bahwa strategi identifikasi model ARIMA yang sederhana dikembangkan pada awal tahun 60-an TETAPI banyak perkembangan / peningkatan yang telah terjadi sejak saat itu.

Diedit setelah data diposting:

Model yang masuk akal diidentifikasi menggunakan http://www.autobox.com/cms/ yang merupakan perangkat lunak yang menggabungkan beberapa ide saya yang disebutkan di atas ketika saya membantu mengembangkannya. masukkan deskripsi gambar di siniUji Chow untuk parameter konstan menyarankan agar data tersegmentasi dan 94 pengamatan terakhir digunakan sebagai parameter model telah berubah seiring waktu. masukkan deskripsi gambar di sini94 nilai terakhir ini menghasilkan persamaan masukkan deskripsi gambar di sinidengan semua koefisien menjadi signifikan. masukkan deskripsi gambar di sini. Plot residu menunjukkan sebaran yang masuk akal masukkan deskripsi gambar di sinidengan ACF berikut menunjukkan keacakan masukkan deskripsi gambar di sini. Grafik Aktual dan Dibersihkan menyala karena menunjukkan outlier signifikan TAPI halus. masukkan deskripsi gambar di sini. Akhirnya sebidang aktual, sesuai, dan perkiraan meringkas pekerjaan kami SEMUA TANPA MENGAMBIL LOGARITMAmasukkan deskripsi gambar di sini. Sudah diketahui tetapi sering dilupakan bahwa transformasi daya seperti obat-obatan .... penggunaan yang tidak beralasan dapat membahayakan Anda. Akhirnya perhatikan bahwa model memiliki struktur AR (2) TETAPI bukan struktur AR (1).

IrishStat
sumber
mengapa kita tidak dapat mengambil transformasi log? Silakan lihat dataset AirPassengers di R, yang memiliki musiman multiplikasi. Mengambil log, mengubahnya menjadi musiman tambahan. Juga jika kita tidak mengambil log, dataset akan memiliki varians yang meningkat, yaitu tidak akan diam. Bagaimana saya bisa menangani dataset seperti itu tanpa melakukan transformasi log? Bisakah Anda jelaskan?
user2338823
"Tidak perlu untuk transformasi logaritmik untuk datanya karena hanya ada beberapa nilai" tidak biasa "pada periode yang tidak ditangani menciptakan kesan yang salah bahwa ada varians kesalahan yang lebih tinggi dengan tingkat yang lebih tinggi". asumsi stasioneritas kekonstanan varian adalah tentang varian kesalahan bukan tentang varian dari seri asli. Perangkat lunak R tidak memungkinkan seseorang untuk mengidentifikasi dan memasukkan anomali secara otomatis. lihat diskusi autobox.com/cms/index.php/blog pada seri ini. DAN autobox.com/pdfs/vegas_ibf_09a.pdf
IrishStat
Tes Box-Cox untuk transformasi daya ASSUMES no outlier sehingga dapat secara salah / tidak sengaja menghubungkan perubahan varians dengan nilai yang diharapkan sehingga secara tidak tepat menyarankan perlunya transformasi. Lihat artikel Tsay docplayer.net/... dari salah satu siswa Box sebagai pengantar untuk berurusan dengan struktur deterministik laten yang tidak diobati, Bye the way jika Anda tidak / tidak bisa menangani pelanggaran saat pertama Anda kemudian dapat secara tidak benar menyesuaikan diri untuk perubahan varians baik melalui transformasi daya atau GLS seperti yang ditunjukkan Tsay.
IrishStat
14

Hanya untuk menjernihkan konsep, dengan inspeksi visual ACF atau PACF Anda dapat memilih (bukan memperkirakan) model ARMA tentatif. Setelah model dipilih, Anda dapat memperkirakan model dengan memaksimalkan fungsi kemungkinan, meminimalkan jumlah kuadrat atau, dalam kasus model AR, dengan menggunakan metode momen.

Model ARMA dapat dipilih setelah inspeksi ACF dan PACF. Pendekatan ini bergantung pada fakta-fakta berikut: 1) ACF dari proses AR stasioner dari urutan p pergi ke nol pada tingkat eksponensial, sedangkan PACF menjadi nol setelah lag p. 2) Untuk proses pemesanan MA q ACF teoritis dan PACF menunjukkan perilaku sebaliknya (ACF memotong setelah lag q dan PACF menjadi nol relatif cepat).

Biasanya jelas untuk mendeteksi urutan model AR atau MA. Namun, dengan proses yang mencakup bagian AR dan MA, lag yang terpotong mungkin kabur karena ACF dan PACF akan membusuk menjadi nol.

Salah satu cara untuk melanjutkan adalah menyesuaikan dulu model AR atau MA (yang tampak lebih jelas dalam ACF dan PACF) dengan urutan rendah. Kemudian, jika ada beberapa struktur lebih lanjut akan muncul di residu, sehingga ACF dan PACF residu diperiksa untuk menentukan apakah persyaratan AR atau MA tambahan diperlukan.

Biasanya Anda harus mencoba dan mendiagnosis lebih dari satu model. Anda juga dapat membandingkannya dengan melihat AIC.

ACF dan PACF yang Anda posting pertama menyarankan ARMA (2,0,0) (0,0,1), yaitu AR reguler (2) dan MA musiman (1). Bagian musiman dari model ditentukan sama seperti bagian biasa tetapi melihat kelambatan urutan musiman (misalnya 12, 24, 36, ... dalam data bulanan). Jika Anda menggunakan R, disarankan untuk menambah jumlah lag standar yang ditampilkan acf(x, lag.max = 60),.

Plot yang Anda tampilkan sekarang mengungkapkan korelasi negatif yang mencurigakan. Jika plot ini didasarkan pada yang sama dengan plot sebelumnya Anda mungkin telah mengambil terlalu banyak perbedaan. Lihat juga posting ini .

Anda dapat memperoleh perincian lebih lanjut, di antara sumber-sumber lain, di sini: Bab 3 dalam Rangkaian Waktu: Teori dan Metode oleh Peter J. Brockwell dan Richard A. Davis dan di sini .

javlacalle
sumber
Kamu benar. Saya mungkin telah mengambil satu perbedaan terlalu banyak. Tapi aku punya satu keraguan. Saya melakukan perbedaan sederhana ( i.imgur.com/1MjLzlX.png ) dan musiman (12) satu ( i.imgur.com/E64Sd7p.png ) keduanya pada data log. Yang mana yang harus saya lihat, yang musiman kan?
4ever belajar
1
@ 4everlearning Right, setelah mengambil perbedaan musiman, ACF dan PACF melihat lebih dekat dengan apa yang bisa kita harapkan untuk proses stasioner. Anda bisa mulai dengan memasang ARIMA (2,0,0) (0,1,1), dalam R arima(x, order = c(2,0,0), seasonal = list(order = c(0,1,1))), dan menampilkan ACF dan PACF dari residu. Waspadai masalah lebih lanjut yang diajukan oleh IrishStat yang harus Anda perhatikan dalam analisis.
javlacalle
Terima kasih. Bagaimana saya mencari pesanan AR dan MA itu? Plus, Kriteria Informasi Akaike menghasilkan nilai negatif untuk model saya. Saya mengerti bahwa ini tidak penting walaupun saya tidak begitu yakin bagaimana membandingkannya dengan model lain, katakanlah AIC = -797.74 dan AIC = -800.00. Mana yang lebih disukai?
belajar
Anda dapat menentukan pesanan mengikuti ide yang diberikan dalam jawaban di atas. Jika Anda melihat bahwa ACF pergi ke nol relatif cepat dan PACF memotong setelah lag 2 maka kemungkinan bahwa struktur AR (2) hadir dalam data. Gagasan sebaliknya berlaku untuk mendeteksi MA. Sebagai rekomendasi umum, mulailah dengan model orde rendah dan periksa residu yang mencari struktur AR atau MA untuk ditambahkan ke model awal.
javlacalle
Sebagai aturan umum, semakin rendah AIC semakin baik modelnya (dengan asumsi bahwa Anda menggunakan data dalam skala yang sama di kedua model, yaitu seri harus dalam level atau mencatat semua model yang Anda bandingkan ).
javlacalle