Ubah analisis titik

8

Bisakah seseorang tolong jelaskan titik perubahan kepada saya. Saya menggunakan paket dalam R, dan saya tidak benar-benar mengerti apa arti metode yang berbeda, pro dan kontra dari masing-masing, dan saya terutama tidak mengerti nilai penalti. Ketika Anda meningkatkan nilai penalti, apa artinya itu dan apa fungsinya? Saya telah melakukan banyak riset online tetapi saya tetap menemukan situs cran R dan R cepat, yang bagus, tetapi cara mereka mengatakan itu tidak memotongnya untuk saya.

Terima kasih banyak.

Darla
sumber
2
Sudahkah Anda membaca dokumentasi ini untuk paket changepoint ?
Jeromy Anglim
Sayangnya, saya melakukan :(
Darla

Jawaban:

21

Ada 3 fungsi utama dalam paket changepoint cpt.mean,, cpt.vardan cpt.meanvar. Sebagai seorang praktisi, ini adalah satu-satunya fungsi dalam paket yang harus Anda butuhkan. Jika Anda berpikir bahwa data Anda mungkin mengandung perubahan dalam mean maka Anda menggunakan cpt.meanfungsinya, dll.

Pertanyaan selanjutnya Anda harus bertanya pada diri sendiri apakah Anda mencari satu atau beberapa perubahan dalam data Anda. The methodargumen menangani ini, ada baikAMOC untuk Paling Banyak Satu Perubahan, dan Pelt, BinSeg dan SegNeigh untuk beberapa perubahan. Beberapa metode changepoint yang ingin Anda gunakan bergantung pada:

a) Pilihan Anda untuk metode distribusi / bebas distribusi (lihat di bawah) dan

b) Seberapa banyak waktu yang Anda miliki / seberapa akurat jawaban yang Anda inginkan. BinSeg cepat tetapi perkiraan, PELT tepat dan cepat tetapi tidak dapat digunakan di semua distribusi, SegNeigh tepat tetapi lambat.

Pertanyaan selanjutnya adalah asumsi apa yang dapat / ingin Anda buat tentang data Anda. Kuncinya di sini adalah bahwa asumsi berlaku untuk setiap set data antara perubahan dan bukan untuk seluruh data. Misalnya, Anda mungkin dapat mengasumsikan distribusi Normal tetapi jika Anda melakukan tes untuk Normalitas pada seluruh data kemungkinan besar akan gagal (karena potensi perubahan). Jadi biasanya kita membuat asumsi, menjalankan analisis changepoint kemudian memeriksa asumsi berdasarkan perubahan yang diidentifikasi. Sekali lagi, tergantung pada jenis perubahan ada berbagai metode distribusi dan bebas distribusi. Lihat dokumentasi untuk masing-masing fungsi untuk pilihan dan jangan ragu untuk mengomentari statistik uji mana yang Anda pikirkan untuk digunakan dan saya dapat membuat daftar asumsi.

Akhirnya, Anda melihat penalti. Penalti memberikan kompromi antara banyak perubahan kecil dan tidak ada perubahan. Jadi, jika Anda menetapkan penalti ke 0 maka Anda mendapatkan perubahan di setiap lokasi yang memungkinkan dan jika Anda mengatur penalti menjadi tak terbatas maka Anda tidak mendapatkan perubahan. Nilai penalti yang tepat tergantung pada data Anda dan pertanyaan yang ingin Anda jawab. Misalnya, Anda mungkin memiliki perubahan rata-rata 0,5 unit tetapi Anda mungkin hanya tertarik pada perubahan 1+ unit. Ada banyak cara untuk memilih penalti Anda:

  1. "oleh mata", yaitu mencoba beberapa nilai yang berbeda sampai Anda menemukan satu yang terlihat sesuai untuk masalah Anda.

  2. "plot-siku", yaitu plot jumlah changepoint yang diidentifikasi terhadap penalti yang digunakan. Ini menciptakan kurva di mana nilai-nilai kecil dari penalti menghasilkan perubahan besar (palsu) dan karena penalti menurunkan perubahan palsu ini turun dengan cepat, laju ini melambat karena hanya perubahan yang benar yang tersisa sebelum perlahan-lahan turun ke bawah tanpa perubahan untuk penalti yang lebih besar . Idenya adalah untuk mencocokkan 2 garis lurus ke kurva ini dan memilih penalti di mana mereka menyeberang. Ini menghasilkan cara ad-hoc tetapi lebih objektif untuk memilih penalti daripada 1.

  3. gunakan kriteria informasi. Ada beberapa seperti AIC, BIC / SIC, Hannan-Quinn yang termasuk dalam paket. Ada yang lain yang tidak termasuk dalam paket tetapi Anda dapat memberikan formula pen.valuejika Anda mau.

Jika Anda memerlukan informasi lebih lanjut atau klarifikasi tentang poin-poin tertentu, cukup komentari dan saya akan mencoba menjawab.

aduna
sumber
Itu sangat membantu, terima kasih. Satu hal saya adalah, saya benar-benar terikat pada nilai penalti. Apa artinya? Ketika mencolokkan secara manual, bagaimana Anda mengartikan sebuah pen.value = .05 ayat a pen.value = .40? Apa yang dikatakan tentang data Anda?
Darla
Ukuran pen.value relatif terhadap data yang Anda kerjakan sehingga Anda tidak dapat benar-benar membandingkan pen.value 0,05 pada satu kumpulan data dengan pen.value 0,4 pada yang lain. Namun, pada set data yang sama, penalti yang lebih kecil akan mengidentifikasi lebih banyak perubahan dan dengan demikian dapat mengidentifikasi perubahan parameter yang lebih kecil. Nilai penalti yang lebih besar mencari perubahan yang lebih besar sebelum menganggapnya "signifikan".
Adunaic
Jadi, bagaimana saya tahu seberapa signifikannya signifikan? Jika saya memasukkan pen.value = .20 saya mendapat 8 changepoint, tetapi jika saya memasukkan pen.value = .30, saya hanya mendapatkan 5 changepoint. Bagaimana saya tahu jika 3 changepoint itu signifikan? Bagaimana saya tahu nilai yang harus saya pertahankan?
Darla
1
lihat jawaban untuk pertanyaan baru Deb di: stats.stackexchange.com/questions/60245/…
adunaic
bagaimana cara menjalankan analisis changepoint bergulir? Apakah itu mungkin?
user1234440