Menafsirkan korelasi CCF dalam R

10

Saya menggunakan ccfuntuk menemukan korelasi antara 2 seri waktu. Saya mendapatkan plot yang terlihat seperti itu:

masukkan deskripsi gambar di sini

Perhatikan bahwa saya terutama tertarik pada korelasi untuk lag = 0. Pertanyaan:

  1. Apakah mengartikannya dengan benar bahwa ada korelasi silang untuk lag = 0, karena untuk lag ini korelasi silang berada di atas garis putus-putus?
  2. Bagaimana saya harus menafsirkan tingkat korelasi silang dalam contoh ini, apakah ini signifikan (seperti yang saya tafsirkan sekarang, ada korelasi silang kecil)?
  3. Bagaimana saya bisa mengekstrak acfnilai hanya untuk lag = 0?
syntagma
sumber

Jawaban:

3

Bagaimana saya bisa mengekstrak hanya nilai acf untuk lag = 0?

The ACF pada lag 0 ( ) adalah selalu 1.corr(Xt,Xt)

Apakah mengartikannya dengan benar bahwa ada korelasi silang untuk lag = 0, karena untuk lag ini korelasi silang berada di atas garis putus-putus?

Jika Anda maksudkan "akankah saya menyimpulkan bahwa korelasi silang populasi adalah nol?" maka ya, jika garis putus-putus itu memiliki tingkat signifikansi yang sama seperti yang akan Anda gunakan (dan asumsi-asumsi berlaku).

Ini tidak benar-benar berarti bahwa populasi korelasi silang adalah benar-benar nol (yang akan tampak menakjubkan). Namun, jika intervalnya cukup ketat di sekitar nol, kadang-kadang mungkin masuk akal untuk memperlakukannya seolah-olah begitu.

Bagaimana saya harus menafsirkan tingkat korelasi silang dalam contoh ini, apakah ini signifikan (seperti yang saya tafsirkan sekarang, ada korelasi silang kecil)?

0,3 tidak selalu kecil, itu tergantung pada tolok ukur Anda. Dalam beberapa aplikasi mungkin cukup besar, yang lain sedang, di yang lain kecil.

Glen_b -Reinstate Monica
sumber
Apakah ini berarti bahwa model tidak dapat divalidasi, karena ada korelasi silang yang signifikan pada lag 0?
Vam
7

Penafsiran Anda tentang plot itu benar. Satu-satunya korelasi silang yang signifikan pada tingkat signifikansi adalah pada titik nol. Jadi, kita tidak bisa mengatakan bahwa satu variabel memimpin variabel lain (yaitu, kita tidak bisa melihat atau mengantisipasi pergerakan dalam satu variabel dengan melihat yang lain).5%

Kedua variabel berkembang secara bersamaan. Korelasi positif, ketika yang satu meningkatkan yang lain juga, dan sebaliknya. Namun korelasinya tidak terlalu kuat (sekitar ).0.3

Anda bisa mendapatkan nilai yang tepat dari korelasi silang hanya dengan menyimpan output dalam suatu objek dan melihat elemen acf.

res <- ccf(x, y, lag.max = 30)
res
# information stored in the output object
names(res)
[1] "acf"    "type"   "n.used" "lag"    "series" "snames"
res$acf
javlacalle
sumber
Anda mungkin ingin melakukan sesuatu seperti data.frame(res$lag, res$acf)sehingga Anda dapat dengan mudah mengetahui di mana lag masing-masing korelasi berlaku.
eipi10