Pertanyaan ini mungkin terlalu mendasar. Untuk tren sementara dari suatu data, saya ingin mengetahui titik di mana perubahan "mendadak" terjadi. Sebagai contoh, pada gambar pertama yang ditunjukkan di bawah ini, saya ingin mengetahui titik perubahan menggunakan beberapa metode statistik. Dan saya ingin menerapkan metode seperti itu di beberapa data lain di mana titik perubahannya tidak jelas (seperti gambar ke-2). Jadi, apakah ada metode umum untuk tujuan seperti itu?
time-series
trend
change-point
pengguna2230101
sumber
sumber
Jawaban:
Jika pengamatan data deret waktu Anda berkorelasi dengan pengamatan sebelumnya, makalah karya Chen dan Liu (1993) [ 1 ] mungkin menarik bagi Anda. Ini menjelaskan metode untuk mendeteksi pergeseran level dan perubahan sementara dalam kerangka model deret waktu rata-rata bergerak autoregresif.[ 1 ]
[1]: Chen, C. dan Liu, LM. (1993),
"Estimasi Bersama Parameter Model dan Efek Outlier dalam Time Series,"
Jurnal Asosiasi Statistik Amerika , 88 : 421, 284-297
sumber
Masalah dalam Statistik ini disebut sebagai Deteksi Peristiwa Temporal (univariat). Ide paling sederhana adalah dengan menggunakan rata-rata bergerak dan standar deviasi. Setiap bacaan yang "keluar dari" penyimpangan 3-standar (aturan praktis) dianggap sebagai "peristiwa". Tentu saja, ada model yang lebih maju yang menggunakan HMM, atau Regresi. Berikut ini adalah ikhtisar pengantar bidang ini .
sumber
sumber
Ada masalah terkait dalam membagi seri atau urutan menjadi mantra dengan nilai konstan idealnya. Lihat Bagaimana saya bisa mengelompokkan data numerik ke dalam membentuk "tanda kurung"? (mis. penghasilan)
Ini bukan masalah yang sama seperti pertanyaannya tidak mengecualikan mantra dengan penyimpangan lambat di setiap atau semua arah, tetapi tanpa perubahan mendadak.
Jawaban yang lebih langsung adalah mengatakan bahwa kami mencari lompatan besar, jadi satu-satunya masalah sebenarnya adalah mendefinisikan lompatan. Gagasan pertama adalah hanya untuk melihat perbedaan pertama antara nilai-nilai tetangga. Bahkan tidak jelas bahwa Anda perlu memperbaiki itu dengan menghilangkan kebisingan terlebih dahulu, seolah-olah lompatan tidak dapat dibedakan dari perbedaan kebisingan, mereka pasti tidak dapat tiba-tiba. Di sisi lain, si penanya jelas menginginkan perubahan mendadak untuk memasukkan perubahan yang sama dan melangkah, sehingga beberapa kriteria seperti varians atau rentang dalam jendela dengan panjang tetap tampaknya diperlukan.
sumber
Area statistik yang Anda cari adalah analisis changepoint. Ada situs web di sini yang akan memberi Anda ikhtisar area dan juga memiliki halaman untuk perangkat lunak.
Jika Anda seorang
R
pengguna maka saya akan merekomendasikanchangepoint
paket untuk perubahan dalam mean danstrucchange
paket untuk perubahan dalam regresi. Jika Anda ingin menjadi Bayesian makabcp
paketnya juga bagus.Secara umum Anda harus memilih ambang yang menunjukkan kekuatan perubahan yang Anda cari. Ada, tentu saja, pilihan ambang batas yang dianjurkan orang dalam situasi tertentu dan Anda dapat menggunakan tingkat kepercayaan asimptotik atau bootstrap untuk mendapatkan kepercayaan diri juga.
sumber
Masalah inferensi ini memiliki banyak nama, termasuk titik perubahan, titik sakelar, titik break, regresi garis putus, regresi tongkat patah, regresi bilinear, regresi linier satu demi satu, regresi linier lokal, regresi tersegmentasi, dan model diskontinuitas.
Berikut ini adalah ikhtisar paket titik perubahan dengan pro / kontra dan contoh yang dikerjakan. Jika Anda tahu jumlah titik perubahan apriori, periksa
mcp
paketnya. Pertama, mari kita simulasikan data:Untuk masalah pertama Anda, ini adalah tiga segmen intersep saja:
Kami dapat merencanakan fit yang dihasilkan:
Di sini, titik perubahan didefinisikan dengan sangat baik (sempit). Mari kita simpulkan kecocokan untuk melihat lokasi yang disimpulkan (
cp_1
dancp_2
):Anda dapat melakukan model yang jauh lebih rumit dengan
mcp
, termasuk memodelkan autoregresi urutan-N (berguna untuk seri waktu), dll. Penafian: Saya adalah pengembang darimcp
.sumber