Saya melakukan beberapa statistik deskriptif pengembalian harian pada indeks saham. Yaitu jika dan adalah tingkat indeks masing-masing pada hari 1 dan 2, maka adalah pengembalian yang saya gunakan (sepenuhnya standar dalam literatur).P 2 l o g e ( P 2
Jadi kurtosis sangat besar dalam beberapa hal ini. Saya melihat sekitar 15 tahun data harian (jadi sekitar pengamatan seri waktu)
means sds mins maxs skews kurts
ARGENTINA -0.00031 0.00965 -0.33647 0.13976 -15.17454 499.20532
AUSTRIA 0.00003 0.00640 -0.03845 0.04621 0.19614 2.36104
CZECH.REPUBLIC 0.00008 0.00800 -0.08289 0.05236 -0.16920 5.73205
FINLAND 0.00005 0.00639 -0.03845 0.04622 0.19038 2.37008
HUNGARY -0.00019 0.00880 -0.06301 0.05208 -0.10580 4.20463
IRELAND 0.00003 0.00641 -0.03842 0.04621 0.18937 2.35043
ROMANIA -0.00041 0.00789 -0.14877 0.09353 -1.73314 44.87401
SWEDEN 0.00004 0.00766 -0.03552 0.05537 0.22299 3.52373
UNITED.KINGDOM 0.00001 0.00587 -0.03918 0.04473 -0.03052 4.23236
-0.00007 0.00745 -0.09124 0.06405 -1.82381 63.20596
AUSTRALIA 0.00009 0.00861 -0.08831 0.06702 -0.74937 11.80784
CHINA -0.00002 0.00072 -0.40623 0.02031 6.26896 175.49667
HONG.KONG 0.00000 0.00031 -0.00237 0.00627 2.73415 56.18331
INDIA -0.00011 0.00336 -0.03613 0.03063 -0.22301 10.12893
INDONESIA -0.00031 0.01672 -0.24295 0.19268 -2.09577 54.57710
JAPAN 0.00008 0.00709 -0.03563 0.06591 0.57126 5.16182
MALAYSIA -0.00003 0.00861 -0.35694 0.13379 -16.48773 809.07665
Pertanyaan saya adalah: Apakah ada masalah?
Saya ingin melakukan analisis deret waktu yang luas atas data ini - analisis regresi OLS dan Kuantil, dan juga Granger Causality.
Baik respons saya (dependen) maupun prediktor (regressor) akan memiliki sifat kurtosis raksasa ini. Jadi saya akan memiliki proses pengembalian ini di kedua sisi persamaan regresi. Jika ketidaknormalan tumpah ke gangguan yang hanya akan membuat kesalahan standar saya varians tinggi kan?
(Mungkin saya perlu bootstrap yang kuat skewness?)
Jawaban:
Silakan melihat-lihat Lambert W x F ekor-berat atau mencoba distribusi Lambert W x F miring (disclaimer: I am the author). Dalam R mereka diimplementasikan dalam paket LambertW .
Posting terkait:
Berikut adalah contoh perkiraan Lambert W x Gaussian yang diterapkan pada pengembalian dana ekuitas.
Metrik ringkasan pengembalian serupa (tidak ekstrem) seperti pada pos OP.
Kebanyakan seri menunjukkan dengan jelas karakteristik non-Normal (kemiringan yang kuat dan / atau kurtosis besar). Mari Gaussianize setiap seri menggunakan Lambert W x Gaussian distribusi berat (= Tukey's h) menggunakan metode estimator momen (
IGMM
).Plot seri waktu menunjukkan lebih sedikit ekor dan juga variasi yang lebih stabil dari waktu ke waktu (meskipun tidak konstan). Menghitung kembali metrik pada hasil rangkaian waktu Gaussianized:
IGMM
Gaussianize()
scale()
Regresi bivariat sederhana
Scatterplot kiri dari seri asli menunjukkan bahwa outlier kuat tidak terjadi pada hari yang sama, tetapi pada waktu yang berbeda di India dan Eropa; selain itu tidak jelas apakah data cloud di pusat tidak mendukung korelasi atau ketergantungan negatif / positif. Karena pencilan sangat mempengaruhi estimasi varians dan korelasi, ada baiknya untuk melihat ketergantungan dengan ekor yang berat dihilangkan (sebar kanan). Di sini polanya jauh lebih jelas dan hubungan positif antara pasar India dan Eropa Timur menjadi jelas.
Kausalitas Granger
Namun, untuk data Gaussian, jawabannya berbeda! Berikut tes dapat tidak menolak H0 bahwa "INDIA yang tidak Granger penyebab EASTEU", tapi masih menolak bahwa "EASTEU tidak Granger penyebab INDIA". Jadi data Gaussianized mendukung hipotesis bahwa pasar Eropa mendorong pasar di India pada hari berikutnya.
sumber
Yang diperlukan adalah model distribusi probabilitas yang lebih sesuai dengan data. Terkadang, tidak ada momen yang ditentukan. Salah satu distribusi tersebut adalah distribusi Cauchy. Meskipun distribusi Cauchy memiliki median sebagai nilai yang diharapkan, tidak ada nilai rata-rata yang stabil, dan tidak ada momen yang lebih tinggi yang stabil. Apa ini artinya adalah bahwa ketika seseorang mengumpulkan data, pengukuran aktual muncul yang terlihat seperti outlier, tetapi merupakan pengukuran aktual. Sebagai contoh, jika seseorang memiliki dua distribusi normal F dan G, dengan rata-rata nol, dan satu membagi F / G, hasilnya tidak memiliki momen pertama dan merupakan distribusi Cauchy. Jadi kami dengan senang hati mengumpulkan data, dan itu terlihat OK seperti 5,3,9,6,2,4 dan kami menghitung rata-rata yang terlihat stabil, kemudian, tiba-tiba kami mendapatkan nilai -32739876 dan nilai rata-rata kami menjadi tidak berarti, tetapi perhatikan, median adalah 4, stabil. Seperti itu dengan distribusi ekor panjang.
Sunting: Anda dapat mencoba distribusi-t Student dengan 2 derajat kebebasan. Distribusi yang memiliki ekor lebih panjang dari distribusi normal, kemiringan dan kurtosis tidak stabil ( Sic , tidak ada), tetapi mean dan varians didefinisikan, yaitu stabil.
Sunting berikutnya: Satu kemungkinan adalah menggunakan regresi Theil. Ngomong-ngomong, itu pemikiran, karena Theil akan bekerja dengan baik tidak peduli seperti apa bentuk ekornya. Mereka dapat melakukan MLR (regresi linier berganda menggunakan median slope). Saya belum pernah melakukan Theil untuk pemasangan data histogram. Tapi, saya telah membuat Theil dengan varian jackknife untuk membangun interval kepercayaan. Keuntungan melakukan itu adalah bahwa Theil tidak peduli apa bentuk distribusi, dan, jawabannya umumnya kurang bias dibandingkan dengan OLS karena biasanya OLS digunakan ketika ada varian sumbu independen yang bermasalah. Bukan berarti Theil benar-benar tidak terikat, itu adalah median slope. Jawabannya memiliki arti yang berbeda juga, ia menemukan kesepakatan yang lebih baik antara variabel dependen dan independen di mana OLS menemukan prediktor kesalahan terkecil dari variabel dependen,
sumber