Analisis antar pasar adalah metode pemodelan perilaku pasar dengan cara menemukan hubungan antara pasar yang berbeda. Sering kali, suatu korelasi dihitung antara dua pasar, katakanlah S&P 500 dan treasury AS 30-Tahun. Perhitungan ini lebih sering didasarkan pada data harga, yang jelas bagi semua orang bahwa itu tidak sesuai dengan definisi deret waktu stasioner.
Kemungkinan solusi samping (menggunakan pengembalian sebagai gantinya), apakah perhitungan korelasi yang datanya non-stasioner bahkan perhitungan statistik yang valid?
Apakah Anda akan mengatakan bahwa perhitungan korelasi semacam itu agak tidak dapat diandalkan, atau hanya omong kosong belaka?
correlation
stationarity
Milktrader
sumber
sumber
Jawaban:
Korelasi mengukur hubungan linear. Dalam konteks informal hubungan berarti sesuatu yang stabil. Ketika kami menghitung korelasi sampel untuk variabel stasioner dan meningkatkan jumlah poin data yang tersedia, korelasi sampel ini cenderung korelasi benar.
Dapat ditunjukkan bahwa untuk harga, yang biasanya adalah jalan acak, korelasi sampel cenderung variabel acak. Ini berarti bahwa tidak peduli berapa banyak data yang kita miliki, hasilnya akan selalu berbeda.
Catatan saya mencoba mengekspresikan intuisi matematika tanpa matematika. Dari sudut pandang matematis, penjelasannya sangat jelas: Contoh momen dari proses stasioner bertemu dalam probabilitas ke konstanta. Contoh momen jalan acak bertemu dengan integral gerakan brown yang merupakan variabel acak. Karena hubungan biasanya dinyatakan sebagai angka dan bukan variabel acak, alasan untuk tidak menghitung korelasi untuk variabel non-stasioner menjadi jelas.
Perbarui Karena kita tertarik korelasi antara dua variabel berasumsi pertama yang mereka datang dari stasioner proses . Stasioneritas menunjukkan bahwa E Z t dan c o v ( Z t , Z t - h ) tidak bergantung pada t . Jadi korelasinyaZt=(Xt,Yt) EZt cov(Zt,Zt−h) t
juga tidak tergantung pada , karena semua jumlah dalam formula berasal dari matriks c o v ( Z t ) , yang tidak tergantung pada t . Jadi perhitungan korelasi sampelt cov(Zt) t
merek akal, karena kita mungkin memiliki harapan yang masuk akal bahwa korelasi sampel akan memperkirakanρ=corr(Xt,Yt). Ternyata harapan ini tidak berdasar, karena untuk proses stasioner memuaskan kondisi tertentu kita memilikiρ→
Sekarang anggaplah bahwa tidak stasioner. Maka c o r r ( X t , Y t ) dapat bergantung pada t . Jadi ketika kita mengamati sampel berukuran T kami potentialy perlu memperkirakan T korelasi yang berbeda ρ t . Hal ini tentu saja tidak layak, sehingga dalam skenario kasus terbaik kita hanya bisa memperkirakan beberapa fungsional ρ t seperti mean atau varians. Tetapi hasilnya mungkin tidak memiliki interpretasi yang masuk akal.Zt corr(Xt,Yt) t T T ρt ρt
Sekarang mari kita periksa apa yang terjadi dengan korelasi dari proses acak berjalan yang mungkin paling banyak dipelajari. Kami menyebutnya proses acak berjalan jika Z t = Σ t s = 1 ( U t , V t ) , di mana C t = ( U t , V t ) adalah proses stasioner. Untuk mempermudah berasumsi bahwa E C t = 0 . KemudianZt=(Xt,Yt) Zt=∑ts=1(Ut,Vt) Ct=(Ut,Vt) ECt=0
Untuk menyederhanakan masalah lebih lanjut, menganggap bahwa adalah white noise. Ini berarti bahwa semua korelasi E ( C t C t + h ) adalah nol untuk h > 0 . Perhatikan bahwa ini tidak membatasi c o r r ( U t , V t ) ke nol.Ct=(Ut,Vt) E(CtCt+h) h>0 corr(Ut,Vt)
Kemudian
Sejauh ini bagus, meskipun prosesnya tidak diam, korelasi masuk akal, meskipun kami harus membuat asumsi yang sama.
Sekarang untuk melihat apa yang terjadi pada sampel korelasi kita perlu menggunakan fakta berikut tentang jalan-jalan acak, yang disebut teorema batas pusat fungsional:
Again for simplicity let us define sample correlation as
Let us start with the variances. We have
This goes to infinity asT increases, so we hit the first problem, sample variance does not converge. On the other hand continuous mapping theorem in conjunction with functional central limit theorem gives us
Similarly we get
So finally for sample correlation of our random walk we get
So although correlation is well defined, sample correlation does not converge towards it, as in stationary process case. Instead it converges to a certain random variable.
sumber
LetW be a discrete random walk. Pick a positive number h . Define the processes P and V by P(0)=1 , P(t+1)=−P(t) if V(t)>h , and otherwise P(t+1)=P(t) ; and V(t)=P(t)W(t) . In other words, V starts out identical to W but every time V rises above h , it switches signs (otherwise emulating W in all respects).
(In this figure (forh=5 ) W is blue and V is red. There are four switches in sign.)
In effect, over short periods of timeV tends to be either perfectly correlated with W or perfectly anticorrelated with it; however, using a correlation function to describe the relationship between V and W wouldn't be useful (a word that perhaps more aptly captures the problem than "unreliable" or "nonsense").
Mathematica code to produce the figure:
sumber