Algoritma Twitter didasarkan pada
Rosner, B., (Mei 1983), "Poin Persentase untuk Prosedur Banyak-outlier ESD Umum", Technometrics, 25 (2), hlm. 165-172
Saya yakin ada banyak teknik dan kemajuan sejak tahun 1983 !. Saya telah menguji data internal saya, dan deteksi anomali Twitter tidak mengidentifikasi outlier yang jelas. Saya akan menggunakan pendekatan lain juga untuk menguji pencilan dalam deret waktu. Yang terbaik yang saya temui adalah prosedur deteksi outlier Tsay yang diimplementasikan dalam perangkat lunak SAS / SPSS / Autobox dan SCA. Semuanya adalah sistem komersial. Ada juga
paket tsoutliers yang bagus tetapi membutuhkan spesifikasi arima
model agar dapat bekerja secara efisien. Saya memiliki masalah dengan pengaturan standar auto.arima
terkait dengan optimasi dan pemilihan model.
Artikel Tsay adalah karya mani dalam deteksi outlier dalam deret waktu. Jurnal terkemuka dalam penelitian peramalan International Journal of Forecasting menyebutkan bahwa artikel Tsay adalah salah satu karya yang paling banyak dikutip dan makalah yang paling berpengaruh dalam artikel yang ditautkan di atas (juga lihat di bawah). Difusi dari pekerjaan penting ini dan algoritma pendeteksian pencilan lainnya dalam peramalan perangkat lunak (terutama dalam perangkat lunak sumber terbuka) jarang terjadi.
Saya telah menemukan beberapa sumber yang dapat membantu Anda tetapi mereka tidak akan semudah / semudah menjalankan skrip R di atas data Anda: - Numenta memiliki sumber terbuka platform NuPIC mereka yang digunakan untuk banyak hal termasuk deteksi anomali . - Proyek Atlas Netflix akan segera merilis alat pendeteksi outlier / anomali sumber terbuka. - Prelert memiliki mesin pendeteksi anomali yang datang sebagai aplikasi sisi server. Uji coba mereka menawarkan penggunaan terbatas yang dapat memenuhi kebutuhan Anda.
Sebagai alternatif, perusahaan saya, Insignum , memiliki produk dalam versi beta yang mencerna data deret waktu dan mendeteksi anomali dengan cara yang sepenuhnya otomatis dan Anda hanya menerima peringatan melalui email ketika anomali terdeteksi. Jangkau di Twitter atau Linkedin dan dengan senang hati saya akan memberi tahu Anda lebih banyak.
sumber
Autobox (perusahaan saya) menyediakan deteksi outlier. Algoritma Twitter mendapatkan outlier besar, tetapi melewatkan yang lebih kecil dibandingkan dengan Autobox .
Butuh waktu lama untuk menjalankan, tetapi hasilnya lebih baik untuk menemukan outlier yang lebih kecil dan juga perubahan musiman yang juga outlier. Di bawah ini adalah model yang menemukan 79 outlier menggunakan 8.560 pengamatan pertama dari 14.398 pengamatan asli. Versi standar maks keluar dari 10.000 pengamatan, tetapi bisa dimodifikasi untuk lebih, tetapi tidak ada alasan nyata untuk memiliki data sebanyak itu ketika Anda ingin mengidentifikasi dan merespons outlier.
Kami dipengaruhi oleh pekerjaan yang dilakukan oleh Tsay pada outlier, pergeseran level, dan perubahan varians dan pekerjaan Chow tentang perubahan parameter bersama dengan pekerjaan kami sendiri dalam mendeteksi perubahan dalam musiman,
Jika Anda mengunduh uji coba 30 hari dan memuat data contoh Twitter dan tentukan frekuensinya menjadi 60 dan menyimpan 3 file pemicu dalam folder instalasi (noparcon.afs, novarcon.afs, notrend.afs) dan buat file yang disebut stepupde. afs dengan 100.
sumber