Auto.arima vs autobox apakah mereka berbeda?

16

Dari membaca posting di situs ini saya tahu ada fungsi R auto.arima(dalam forecast paket ). Saya juga tahu bahwa IrishStat , anggota situs ini membuat paket komersial autobox pada awal 1980-an. Karena dua paket ini ada saat ini dan secara otomatis memilih model arima untuk set data yang diberikan, apa yang mereka lakukan secara berbeda? Apakah mereka akan menghasilkan model yang berbeda untuk kumpulan data yang sama?

Michael R. Chernick
sumber
Terima kasih atas hasil edit @Wayne. Saya tidak familar dengan paket perkiraan R tetapi saya yakin itulah yang saya maksudkan untuk dibandingkan dengan autobox.
Michael R. Chernick
(Saya baru saja membuat sedikit perubahan "auto-arima" menjadi "auto.arima".) Mungkin ada auto.arimafungsi - fungsi lain di luar sana dalam paket lain, tetapi jelas ada satu di dalamnya forecast, yang uraiannya adalah: "Mengembalikan model ARIMA terbaik sesuai baik nilai AIC, AICc atau BIC. Fungsi melakukan pencarian atas model yang mungkin dalam batasan urutan yang disediakan. "
Wayne
1
AUTOBOX memperlakukan identifikasi otomatis secara holistik dengan mengulangi meskipun identifikasi otomatis dengan benar-benar memperkirakan dan kemudian melakukan prosedur step-up dan step-down diagnostik untuk membuat model yang hanya memiliki parameter signifikan secara statistik sementara memiliki proses kesalahan yang bebas dari struktur yang dapat diidentifikasi. . Dengan cara ini mengikuti skrip iterasi. Versi awal AUTOBOX sekitar tahun 1975 mencoba menggunakan "satu pendekatan statistik" tetapi ini ditemukan kurang sesuai karena model yang diidentifikasi memiliki struktur yang redundan atau konyol (5,1,2 misalnya) atau terbukti tidak cukup struktur.
IrishStat
1
@IrishStat Kedengarannya seperti pendekatan yang bagus. Apa yang Anda lakukan jika Anda menemukan dua model yang bersaing yang memenuhi kebutuhan Anda. Tampaknya kesurupan. Apakah Anda merekomendasikan model "optimal" berdasarkan kriteria tertentu? Saya menyadari memilih model dengan hanya "parameter signifikan secara statistik" mungkin cenderung mendukung kekikiran tetapi tidak mungkin untuk memiliki proses AR paramter rendah dan model AEMA pesanan rendah lainnya di mana semua parameter signifikan secara statistik dan residu terlihat seperti putih kebisingan?
Michael R. Chernick
1
@IriehStat. Saya setuju dengan kamu. Pada akhirnya apa yang Anda lakukan untuk pengguna. Apakah Anda menyediakan hanya satu model atau mungkin Anda memberikan daftar model bersaing yang dapat diterima? Jika bukan yang terakhir mungkin itu akan menjadi pilihan yang baik untuk menambahkan di mana Anda membatasi daftar ke sejumlah kecil.
Michael R. Chernick

Jawaban:

9

michael / wayne

AUTOBOX pasti akan memberikan / mengidentifikasi model yang berbeda jika satu atau lebih dari kondisi berikut terpenuhi

1) ada pulsa dalam data

2) ada 1 atau lebih level / step shift dalam data

3) jika ada pulsa musiman dalam data

4) ada 1 atau lebih tren waktu lokal dalam data yang tidak hanya diatasi

5) jika parameter model berubah seiring waktu

6) jika varians kesalahan berubah dari waktu ke waktu dan tidak ada transformasi daya yang memadai.

Dalam hal contoh tertentu, saya menyarankan agar Anda berdua memilih / membuat seri waktu dan memposting keduanya ke web. Saya akan menggunakan AUTOBOX untuk menganalisis data dalam mode tanpa pengawasan dan saya akan memposting model ke daftar. Anda kemudian menjalankan program R dan masing-masing dari Anda membuat analisis objektif yang terpisah dari kedua hasil, menunjukkan persamaan dan perbedaan. Kirim kedua model itu lengkap dengan semua bahan pendukung yang tersedia termasuk syarat kesalahan akhir kepada saya untuk komentar saya. Ringkas dan sajikan hasil-hasil ini ke dalam daftar dan kemudian mintalah pembaca daftar untuk MEMILIH prosedur mana yang paling baik bagi mereka.

IrishStat
sumber
Apakah maksud Anda kontes seperti ini ?
whuber
@whuber Ya. Mungkin bahkan menggunakan beberapa "contoh buku teks tidak dikenal / kode" yang dapat digunakan sebagai latar belakang.
IrishStat
22

Mereka mewakili dua pendekatan berbeda untuk dua masalah yang sama tetapi berbeda. Saya menulis auto.arimadan @IrishStat adalah penulis Autobox.

auto.arima()cocok untuk model ARIMA (musiman) termasuk ketentuan drift. Autoboxcocok untuk mentransfer model fungsi untuk menangani perubahan level dan outlier. Model ARIMA adalah kasus khusus dari model fungsi transfer.

Bahkan jika Anda mematikan pergeseran level dan deteksi outlier Autobox, Anda akan mendapatkan model ARIMA berbeda dari auto.arima()karena pilihan yang berbeda dalam cara mengidentifikasi parameter ARIMA.

Dalam pengujian saya pada data persaingan M3 dan M, auto.arima()menghasilkan perkiraan yang lebih akurat daripada Autoboxdata ini. Namun, Autoboxakan lebih baik dengan data yang berisi outlier utama dan pergeseran level.

Rob Hyndman
sumber
3
Saya percaya bahwa Anda merujuk ke versi AUTOBOX dari bertahun-tahun yang lalu. AUTOBOX telah berubah secara signifikan selama bertahun-tahun. Jika saya tidak salah Anda hanya membandingkan akurasi dari 1 asal yang saya yakin Anda akan setuju adalah sampel dari 1. Akurasi perlu dievaluasi dari sejumlah asal.
IrishStat
15
Saya merujuk pada perbandingan yang diterbitkan di ribuan seri. Sebagai Pemimpin Redaksi Jurnal Peramalan Internasional, saya pikir saya punya beberapa ide tentang cara mengevaluasi perkiraan.
Rob Hyndman
2
Saya tidak bermaksud pertanyaan ini untuk mengeluarkan argumen tentang siapa yang memiliki algoritma peramalan terbaik. Saya pikir baik autobox dan auto.arima mungkin paket yang sangat bagus. Perbandingan head to head mungkin tidak adil karena berbagai alasan. 1) Pengguna mungkin tidak cukup ahli untuk tahu bagaimana menilai mereka. 2) Akurasi peramalan pada satu seri waktu adalah bidikan omong kosong. Seseorang mungkin memiliki kesalahan kuadrat rata-rata yang lebih rendah dalam prediksi, tetapi setiap kali keacakan terlibat harus diperhitungkan. Anda perlu melihat beberapa seri dan seperti yang disarankan IrishStat, Anda harus melihat titik awal yang berbeda.
Michael R. Chernick
Poin-poin berbeda untuk memulai peramalan akan bermanfaat. 3) Dalam dunia ARIMA ada banyak representasi untuk model deret waktu yang sama, proses AR hingga memiliki representasi rata-rata bergerak yang tak terbatas dan sebaliknya. Jadi AR pesanan rendah bisa hampir sama dengan rata-rata bergerak pesanan tinggi atau ARMA. Box selalu menyarankan mengikuti prinsip kekikiran. Tetapi jika Anda memiliki banyak data, Anda bisa mendapatkan estimasi parameter yang baik dan model orde tinggi dapat menghasilkan perkiraan yang hampir sama dengan perkiraan sebelumnya. 4) Kedua paket memiliki tujuan yang berbeda.
Michael R. Chernick
3
Metode ini telah berkembang seiring waktu. Dave Reilly sangat aktif di situs ini sebagai IrishStat dan dia sangat terbuka untuk menjelaskan cara kerjanya secara umum. Ini adalah aspek penting dari bisnis untuk memiliki rahasia dagang dan algoritma kepemilikan. Dari sudut pandangnya, R melukai bisnisnya seperti halnya untuk SPlus. Tapi dia tidak menunjukkan kepahitan dan sangat ingin menunjukkan perangkat lunaknya seperti yang Anda lihat hari ini. Dia juga bersedia melakukan tes terhadap pesaing dan saya percaya dia telah memasuki kompetisi perkiraan seri waktu.
Michael R. Chernick
11

EDIT: Per komentar Anda, saya percaya bahwa jika Anda mematikan banyak autoboxpilihan, Anda mungkin akan mendapatkan jawaban yang sama auto.arima. Tetapi jika Anda tidak, dan di hadapan pencilan pasti akan ada perbedaan: auto.arimatidak peduli pencilan, sementara autoboxakan mendeteksi dan menanganinya dengan tepat, yang akan memberikan model yang lebih baik. Mungkin ada perbedaan lain juga, dan saya yakin IrishStat dapat menggambarkannya.


Saya percaya autoboxmendeteksi outlier dan hal-hal lain di luar sekedar mencari koefisien AR, I, dan MA terbaik. Jika itu benar, maka akan memerlukan lebih banyak analisis dan beberapa fungsi R lainnya untuk memiliki fungsi yang sama. Dan IrishStats adalah anggota yang berharga dari komunitas ini, dan cukup ramah.

Tentu saja, R gratis dan dapat melakukan banyak hal di luar ARIMA.

Pilihan lain yang gratis untuk ARIMA bergaya ekonomi adalah X13-ARIMA SEATS, dari Biro Sensus AS, yang bersifat open source. Ada binari untuk Windows dan Linux, tetapi kompilasi langsung di Mac saya, mengingat bahwa saya sudah memuat kompiler gfortran gnu. Ini adalah penerus X12-ARIMA, dan baru saja dirilis dalam beberapa hari terakhir, setelah bertahun-tahun pengembangan dan pengujian. (Ini memperbarui X12 dan juga menambahkan fitur SEATS / TRAMO. X12 adalah alat resmi AS, sementara SEATS / TRAMO berasal dari Bank Spanyol dan merupakan "alat Eropa".)

Saya sangat suka X12 (dan sekarang X13) banyak. Jika Anda mengeluarkan cukup banyak diagnostik dan membacanya dan mempelajari artinya, sebenarnya itu adalah pendidikan yang cukup baik dalam ARIMA dan rangkaian waktu. Saya telah mengembangkan alur kerja saya sendiri, tetapi ada paket R x12untuk melakukan sebagian besar pekerjaan dari dalam R (Anda masih harus membuat file input model (".spc") untuk X12).

Saya katakan X12 bagus dalam "gaya ekonomi" ARIMA berarti data bulanan dengan lebih dari 3 tahun data. (Anda memerlukan 5+ tahun data untuk menggunakan beberapa fitur diagnostik.) Ini memiliki fitur identifikasi outlier, dapat menangani semua jenis spesifikasi outlier, dan dapat menangani liburan, liburan mengambang, efek hari perdagangan, dan sejumlah hal ekonomi. Ini alat yang digunakan pemerintah AS untuk membuat data yang disesuaikan secara musiman.

Wayne
sumber
Pertanyaan saya benar-benar diberikan satu set data akan apakah dua algoritma kemungkinan menghasilkan pilihan model yang berbeda. Ini benar-benar slection otomatis yang saya tertarik dan tidak qny fitur diagnostik lain yang satu mungkin memiliki yang lain tidak. Diketahui bahwa keluarga model ARMA dan dua model dalam keluarga dapat persis atau hampir persis representasi alternatif dari model yang sama. Jadi jika ada perbedaan kecil dalam pemilihan proceudres saya akan berpikir mereka bisa memberikan pilihan model yang berbeda.
Michael R. Chernick
3
@MichaelChernick: Ah. Dugaan saya adalah bahwa jika Anda mematikan semua barang otomatis di autoboxAnda akan mendapatkan jawaban yang sama. Tapi salah satu poin penggunaannya autoboxadalah ia akan mendeteksi outlier dan menanganinya, sehingga model yang dikembalikan akan berbeda jika ada outlier.
Wayne
@Wayne +1 untuk informasi tambahan tentang X13-ARIMA SEATS dan SEATS / TRAMO.
Graeme Walsh
@Wayne By the way, "Alat Eropa" lain adalah DEMETRA + .
Graeme Walsh