Bisakah seseorang tolong jelaskan titik perubahan kepada saya. Saya menggunakan paket dalam R, dan saya tidak benar-benar mengerti apa arti metode yang berbeda, pro dan kontra dari masing-masing, dan saya terutama tidak mengerti nilai penalti. Ketika Anda meningkatkan nilai penalti, apa artinya itu dan apa fungsinya? Saya telah melakukan banyak riset online tetapi saya tetap menemukan situs cran R dan R cepat, yang bagus, tetapi cara mereka mengatakan itu tidak memotongnya untuk saya.
Terima kasih banyak.
change-point
Darla
sumber
sumber
Jawaban:
Ada 3 fungsi utama dalam paket changepoint
cpt.mean
,,cpt.var
dancpt.meanvar
. Sebagai seorang praktisi, ini adalah satu-satunya fungsi dalam paket yang harus Anda butuhkan. Jika Anda berpikir bahwa data Anda mungkin mengandung perubahan dalam mean maka Anda menggunakancpt.mean
fungsinya, dll.Pertanyaan selanjutnya Anda harus bertanya pada diri sendiri apakah Anda mencari satu atau beberapa perubahan dalam data Anda. The
method
argumen menangani ini, ada baikAMOC untuk Paling Banyak Satu Perubahan, dan Pelt, BinSeg dan SegNeigh untuk beberapa perubahan. Beberapa metode changepoint yang ingin Anda gunakan bergantung pada:a) Pilihan Anda untuk metode distribusi / bebas distribusi (lihat di bawah) dan
b) Seberapa banyak waktu yang Anda miliki / seberapa akurat jawaban yang Anda inginkan. BinSeg cepat tetapi perkiraan, PELT tepat dan cepat tetapi tidak dapat digunakan di semua distribusi, SegNeigh tepat tetapi lambat.
Pertanyaan selanjutnya adalah asumsi apa yang dapat / ingin Anda buat tentang data Anda. Kuncinya di sini adalah bahwa asumsi berlaku untuk setiap set data antara perubahan dan bukan untuk seluruh data. Misalnya, Anda mungkin dapat mengasumsikan distribusi Normal tetapi jika Anda melakukan tes untuk Normalitas pada seluruh data kemungkinan besar akan gagal (karena potensi perubahan). Jadi biasanya kita membuat asumsi, menjalankan analisis changepoint kemudian memeriksa asumsi berdasarkan perubahan yang diidentifikasi. Sekali lagi, tergantung pada jenis perubahan ada berbagai metode distribusi dan bebas distribusi. Lihat dokumentasi untuk masing-masing fungsi untuk pilihan dan jangan ragu untuk mengomentari statistik uji mana yang Anda pikirkan untuk digunakan dan saya dapat membuat daftar asumsi.
Akhirnya, Anda melihat penalti. Penalti memberikan kompromi antara banyak perubahan kecil dan tidak ada perubahan. Jadi, jika Anda menetapkan penalti ke 0 maka Anda mendapatkan perubahan di setiap lokasi yang memungkinkan dan jika Anda mengatur penalti menjadi tak terbatas maka Anda tidak mendapatkan perubahan. Nilai penalti yang tepat tergantung pada data Anda dan pertanyaan yang ingin Anda jawab. Misalnya, Anda mungkin memiliki perubahan rata-rata 0,5 unit tetapi Anda mungkin hanya tertarik pada perubahan 1+ unit. Ada banyak cara untuk memilih penalti Anda:
"oleh mata", yaitu mencoba beberapa nilai yang berbeda sampai Anda menemukan satu yang terlihat sesuai untuk masalah Anda.
"plot-siku", yaitu plot jumlah changepoint yang diidentifikasi terhadap penalti yang digunakan. Ini menciptakan kurva di mana nilai-nilai kecil dari penalti menghasilkan perubahan besar (palsu) dan karena penalti menurunkan perubahan palsu ini turun dengan cepat, laju ini melambat karena hanya perubahan yang benar yang tersisa sebelum perlahan-lahan turun ke bawah tanpa perubahan untuk penalti yang lebih besar . Idenya adalah untuk mencocokkan 2 garis lurus ke kurva ini dan memilih penalti di mana mereka menyeberang. Ini menghasilkan cara ad-hoc tetapi lebih objektif untuk memilih penalti daripada 1.
gunakan kriteria informasi. Ada beberapa seperti AIC, BIC / SIC, Hannan-Quinn yang termasuk dalam paket. Ada yang lain yang tidak termasuk dalam paket tetapi Anda dapat memberikan formula
pen.value
jika Anda mau.Jika Anda memerlukan informasi lebih lanjut atau klarifikasi tentang poin-poin tertentu, cukup komentari dan saya akan mencoba menjawab.
sumber