Contoh kehidupan nyata dari perbedaan antara independensi dan korelasi

9

Diketahui bahwa independensi variabel acak menyiratkan korelasi nol tetapi korelasi nol tidak perlu menyiratkan independensi.

Saya menemukan banyak contoh matematika yang menunjukkan ketergantungan meskipun tidak ada korelasi. Adakah contoh kehidupan nyata untuk mendukung fakta ini?

user46697
sumber
2
Hati-hati, hanya nol korelasi dan variabel normal bersama menyiratkan independensi.
Francis
2
@ Sidesh "Tetapi karena volume bukan fungsi linear dari panjang, mereka tidak berkorelasi." Yah, tidak berkorelasi sempurna . Tetapi mereka akan berkorelasi positif.
Silverfish
1
@Iddhesh: itu hanya akan berfungsi jika ...E[length4]-E[length]E[length3]=0
Francis
1
Jangan ragu untuk memasukkan komentar tentang distribusi normal kembali jika Anda tidak setuju dengan suntingan saya. Tapi saya pikir itu akan lebih baik dihapus karena (1) itu adalah masalah sampingan yang mengganggu untuk pertanyaan utama Anda, (2) itu sudah (saya pikir) sudah ditanyakan di CV sebelum jadi akan menjadi duplikat dari materi yang ada di sini, ( 3) Saya tidak ingin itu menyebabkan kebingungan di antara pembaca masa depan. Saya telah mencoba mengedit pertanyaan sedemikian rupa sehingga akan meningkatkan peluangnya untuk dibuka kembali: Saya pikir pertanyaan ini sangat berbeda dari "statistik matematika" yang membahas topik yang sama.
Silverfish
2
Saya masih berpikir pertanyaan ini sangat bagus, dan mungkin menarik beberapa jawaban menarik lebih lanjut jika bisa dibuka kembali (yang mungkin melibatkan beberapa pengeditan untuk membedakannya dengan jelas dari utas yang saat ini dianggap duplikat). Saya telah mengangkat utas tentang Meta tentang apa yang diperlukan agar pertanyaan ini dibuka kembali. Semua komentar diterima.
Silverfish

Jawaban:

6

Pengembalian saham adalah contoh kehidupan nyata yang layak dari apa yang Anda minta. Ada korelasi yang sangat dekat dengan nol antara pengembalian S&P 500 hari ini dan kemarin. Namun, ada ketergantungan yang jelas: pengembalian kuadrat secara autokorelasi positif; periode volatilitas tinggi dikelompokkan dalam waktu.

Kode R:

library(ggplot2)
library(grid)
library(quantmod)

symbols   <- new.env()
date_from <- as.Date("1960-01-01")
date_to   <- as.Date("2016-02-01")
getSymbols("^GSPC", env=symbols, src="yahoo", from=date_from, to=date_to)  # S&P500

df <- data.frame(close=as.numeric(symbols$GSPC$GSPC.Close),
                 date=index(symbols$GSPC))
df$log_return     <- c(NA, diff(log(df$close)))
df$log_return_lag <- c(NA, head(df$log_return, nrow(df) - 1))

cor(df$log_return,   df$log_return_lag,   use="pairwise.complete.obs")  # 0.02
cor(df$log_return^2, df$log_return_lag^2, use="pairwise.complete.obs")  # 0.14

acf(df$log_return,     na.action=na.pass)  # Basically zero autocorrelation
acf((df$log_return^2), na.action=na.pass)  # Squared returns positively autocorrelated

p <- (ggplot(df, aes(x=date, y=log_return)) +
      geom_point(alpha=0.5) +
      theme_bw() + theme(panel.border=element_blank()))
p
ggsave("log_returns_s&p.png", p, width=10, height=8)

Rentang waktu pengembalian log pada S&P 500:

mencatat waktu pengembalian

Jika pengembalian independen melalui waktu (dan diam), akan sangat tidak mungkin untuk melihat pola volatilitas berkerumun tersebut, dan Anda tidak akan melihat autokorelasi dalam pengembalian log kuadrat.

Adrian
sumber
3

Contoh lain adalah hubungan antara stres dan nilai ujian. Hubungannya adalah bentuk U terbalik dan korelasinya sangat rendah meskipun penyebabnya tampak cukup jelas.

Peter Flom
sumber
2
Itu contoh yang rapi. Apakah Anda memiliki data atau ini hanya berdasarkan introspeksi / pengalaman mengajar?
Adrian
1
Saya melihat studi ini, tetapi saya melihatnya bertahun-tahun yang lalu jadi saya tidak memiliki kutipan atau data aktual.
Peter Flom