Apa yang ditunjukkan oleh grafik autokorelasi (panda)?

12

Saya seorang pemula dan saya mencoba memahami apa yang ditunjukkan grafik autokorelasi.

Saya telah membaca beberapa penjelasan dari sumber yang berbeda seperti halaman ini atau halaman Wikipedia terkait yang tidak saya kutip di sini.

Saya memiliki kode yang sangat sederhana ini, di mana saya memiliki tanggal dalam indeks saya selama setahun dan nilainya bertambah dari 0 menjadi 365 untuk setiap indeks .. ( 1984-01-01:0, 1984-01-02:1 ... 1984-12-31:365)

import numpy as np
import pandas as pd
from pandas.plotting import autocorrelation_plot
import matplotlib.pyplot as plt

dr = pd.date_range(start='1984-01-01', end='1984-12-31')

df = pd.DataFrame(np.arange(len(dr)), index=dr, columns=["Values"])
autocorrelation_plot(df)
plt.show()

di mana grafik yang dicetak akan

masukkan deskripsi gambar di sini

Saya dapat memahami dan melihat mengapa grafik dimulai 1.00sejak:

Autokorelasi dengan lag nol selalu sama dengan 1, karena ini mewakili autokorelasi antara setiap istilah dan dirinya sendiri. Nilai dan nilai dengan lag nol akan selalu sama.

Ini bagus, tetapi mengapa grafik ini pada lag 50 memiliki nilai sekitar 0,65 misalnya? Dan mengapa itu turun di bawah 0? Jika saya tidak menunjukkan kode yang saya miliki, apakah mungkin untuk menyimpulkan bahwa grafik autokorelasi ini menunjukkan serangkaian waktu dari nilai yang meningkat? Jika demikian, dapatkah Anda mencoba menjelaskannya kepada seorang pemula bagaimana Anda dapat menyimpulkannya?

Koray Tugay
sumber

Jawaban:

12

h

γ^(h)=1nt=1nh(xt+hx¯)(xtx¯)

hhtt+h

183h=130

t=234t+h=365

t=1t=53t+h

t=54t=182

t=183t=234tt+h

Apakah Anda melihat bagaimana hal ini akan menghasilkan korelasi rata-rata karena kontribusi yang kira-kira sama untuk fungsi autokovarians dari titik kovarien positif dan titik kovarien negatif?

Anda mungkin memperhatikan bahwa ada lebih banyak poin yang mengovariasikan secara negatif daripada poin yang mengovariasikan secara positif. Namun, secara intuisi, titik kovarien positif memiliki magnitudo lebih besar (karena mereka jauh dari rata-rata) sedangkan titik kovarien negatif berkontribusi besarnya lebih kecil ke fungsi autokovarians karena mereka semakin dekat dengan rata-rata. Dengan demikian, ini menghasilkan fungsi autokovarian sekitar nol.

Kevin Li
sumber