Analisis deret waktu dengan banyak nilai nol

19

Masalah ini sebenarnya tentang deteksi kebakaran, tetapi sangat analog dengan beberapa masalah deteksi peluruhan radioaktif. Fenomena yang diamati bersifat sporadis dan sangat bervariasi; dengan demikian, deret waktu akan terdiri dari string panjang nol yang terganggu oleh nilai variabel.

Tujuannya bukan hanya menangkap peristiwa (istirahat di nol), tetapi karakterisasi kuantitatif dari peristiwa itu sendiri. Namun, sensor terbatas, dan dengan demikian kadang-kadang akan merekam nol bahkan jika "kenyataan" tidak nol. Untuk alasan ini, nol harus dimasukkan saat membandingkan sensor.

Sensor B mungkin lebih sensitif daripada Sensor A, dan saya ingin dapat menggambarkannya secara statistik. Untuk analisis ini, saya tidak memiliki "kebenaran," tetapi saya memiliki Sensor C, yang tidak tergantung pada Sensor A&B. Jadi harapan saya adalah bahwa kesepakatan yang lebih baik antara A / B dan C menunjukkan kesepakatan yang lebih baik dengan "kebenaran." (Ini mungkin terlihat goyah, tetapi Anda harus percaya padaku - Saya di tanah yang kuat di sini, berdasarkan apa yang diketahui dari penelitian lain tentang sensor).

Masalahnya, kemudian, adalah bagaimana mengukur "perjanjian waktu yang lebih baik." Korelasi adalah pilihan yang jelas, tetapi akan dipengaruhi oleh semua nol itu (yang tidak dapat ditinggalkan), dan tentu saja secara tidak proporsional dipengaruhi oleh nilai maksimum. RMSE juga bisa dihitung, tetapi akan sangat berbobot terhadap perilaku sensor dalam kasus mendekati nol.

T1: Apa cara terbaik untuk menerapkan penskalaan logaritmik ke nilai bukan nol yang kemudian akan dikombinasikan dengan nol dalam analisis deret waktu?

T2: "Praktik terbaik" apa yang dapat Anda rekomendasikan untuk analisis deret waktu dari jenis ini, di mana perilaku dengan nilai bukan nol adalah fokus, tetapi nilai nol mendominasi dan tidak dapat dikecualikan?

Ed Hyer
sumber

Jawaban:

11

Untuk menyatakan kembali pertanyaan Anda, "Bagaimana analis menangani periode panjang tanpa permintaan yang tidak mengikuti pola tertentu?"

Jawaban untuk pertanyaan Anda adalah Analisis Permintaan Berselang atau Analisis Data Jarang. Ini muncul secara normal ketika Anda memiliki "banyak nol" relatif terhadap jumlah non-nol. Masalahnya adalah bahwa ada dua variabel acak; waktu antara acara dan ukuran acara yang diharapkan. Seperti yang Anda katakan, autocorrelation (acf) dari rangkaian bacaan lengkap tidak ada artinya karena urutan nol secara salah meningkatkan acf. Anda dapat mengejar utas seperti "metode Croston" yang merupakan prosedur berbasis model daripada prosedur berbasis data. Metode Croston rentan terhadap pencilan dan perubahan / tren / pergeseran tingkat dalam tingkat permintaan yaitu permintaan dibagi dengan jumlah periode sejak permintaan terakhir.Sebuah pendekatan yang jauh lebih ketat mungkin untuk mengejar "Data Jarang - Data Bervariasi Tidak Seja" atau pencarian seperti itu. Solusi yang agak cerdik disarankan kepada saya oleh Prof. Ramesh Sharda dari OSU dan saya telah menggunakannya selama beberapa tahun dalam praktik konsultasi saya. Jika suatu seri memiliki titik waktu di mana penjualan muncul dan periode waktu yang lama di mana tidak ada penjualan muncul, adalah mungkin untuk mengubah penjualan menjadi penjualan per periode dengan membagi penjualan yang diamati dengan jumlah periode tanpa penjualan sehingga memperoleh nilai. Kemudian dimungkinkan untuk mengidentifikasi model antara kurs dan interval antara penjualan yang berpuncak pada kurs yang diperkirakan dan interval yang diperkirakan. Anda dapat mengetahui lebih lanjut tentang hal ini di autobox.com dan google "permintaan terputus-putus" Jika suatu seri memiliki titik waktu di mana penjualan muncul dan periode waktu yang lama di mana tidak ada penjualan muncul, adalah mungkin untuk mengubah penjualan menjadi penjualan per periode dengan membagi penjualan yang diamati dengan jumlah periode tanpa penjualan sehingga memperoleh nilai. Kemudian dimungkinkan untuk mengidentifikasi model antara kurs dan interval antara penjualan yang berpuncak pada kurs yang diperkirakan dan interval yang diperkirakan. Anda dapat mengetahui lebih lanjut tentang hal ini di autobox.com dan google "permintaan terputus-putus" Jika suatu seri memiliki titik waktu di mana penjualan muncul dan periode waktu yang lama di mana tidak ada penjualan muncul, adalah mungkin untuk mengubah penjualan menjadi penjualan per periode dengan membagi penjualan yang diamati dengan jumlah periode tanpa penjualan sehingga memperoleh nilai. Kemudian dimungkinkan untuk mengidentifikasi model antara kurs dan interval antara penjualan yang berpuncak pada kurs yang diperkirakan dan interval yang diperkirakan. Anda dapat mengetahui lebih lanjut tentang hal ini di autobox.com dan google "permintaan terputus-putus"

IrishStat
sumber
1
Saya memiliki masalah perkiraan dengan permintaan yang terputus-putus. Saya diminta untuk menyelesaikannya. Saya tahu ada beberapa perangkat lunak khusus untuk perkiraan saat ini tetapi tidak gratis. Bisakah Anda memberi tahu saya jika Anda mengetahui adanya fungsi bawaan pada perangkat lunak open source (seperti R, misalnya) untuk menyelesaikan masalah ini? Saya sudah mencari tetapi tidak bisa menemukannya sejauh ini ... Terima kasih!
Assu
1
@assu: Saya tidak mengetahui adanya perangkat lunak gratis yang memenuhi kebutuhan Anda.
IrishStat
4
@assu. The croston()fungsi dalam forecastpaket di R akan menerapkan metode Croston untuk data permintaan peramalan intermiten.
Rob Hyndman