Korelasi antara X dan XY

11

Jika saya memiliki dua variabel acak independen X dan Y, apa korelasi antara X dan produk XY? Jika ini tidak diketahui, saya akan tertarik untuk mengetahui setidaknya apa yang terjadi dalam kasus spesifik X dan Y yang normal dengan nol rata-rata, jika itu lebih mudah untuk diselesaikan.

Roberto
sumber
4
Apa yang memotivasi pertanyaan ini? Saya bertanya-tanya apakah akan lebih baik jika kita juga membahas hal lain di sini. Apakah Anda melakukan studi di mana Anda telah membuat variabel XY karena beberapa alasan?
gung - Reinstate Monica

Jawaban:

13

Larutan

Saya bawa bahwa solusi yang valid akan menjadi salah satu yang mengekspresikan - jika mungkin - korelasi dalam hal sifat-sifat yang terpisah dari variabel dan . Komputasi korelasi akan melibatkan menghitung covariances dari monomials di dan . Sangat ekonomis untuk menyelesaikan ini sekaligus. Cukup amati ituY X YXYXY

  1. Ketika dan adalah independen dan dan adalah kekuatan, maka dan adalah independen;Y i j X i Y jXYijXiYj

  2. Ekspektasi produk dari variabel independen adalah produk dari harapan mereka.

Hal ini akan memberikan rumus dalam hal saat-saat dan .YXY

Hanya itu yang ada untuk itu.


Detail

Tuliskan , dll. Untuk saat ini. Jadi, untuk bilangan apa pun yang perhitungannya masuk akal dan menghasilkan angka yang terbatas,i , j , k , lμi(X)=E(Xi)i,j,k,l

Cov(XiYj,XkYl)=E(XiYjXkYl)E(XiYj)E(XkYl)=μi+k(X)μj+l(Y)μi(X)μk(X)μj(Y)μl(Y).

Perhatikan bahwa varians dari setiap variabel acak adalah kovariansnya sendiri, jadi kami tidak perlu melakukan perhitungan khusus untuk varian.

Sekarang harus jelas bagaimana menghitung momen yang melibatkan monomial, dari kekuatan apa pun, dari sejumlah variabel acak independen. Sebagai aplikasi, terapkan hasil ini pada definisi korelasi, yang merupakan kovarians dibagi dengan akar kuadrat dari varians:

Cor(X,XY)=Cov(X1Y0,X1Y1)Cov(X1Y0,X1Y0) Cov(X1Y1,X1Y1)=μ2(X)μ1(Y)μ1(X)2μ1(Y)(μ2(X)μ1(X)2)(μ2(X)μ2(Y)μ1(X)2μ2(Y)2).

Ada berbagai penyederhanaan aljabar yang dapat Anda pilih jika Anda ingin menghubungkan ini dengan harapan, varian, dan kovarian dari variabel asli, tetapi menjalankannya di sini tidak akan memberikan wawasan lebih lanjut.

whuber
sumber
14

Dengan menggunakan hukum kovarian total dan independensi dan , Menggunakan hukum varians total, dan sekali lagi, independensi, Perhatikan bagaimanaY Cov ( X , X Y )XY

Cov(X,XY)=ECov(X,XY|Y)+Cov(EX|Y,EXY|Y)=E(YCov(X,X))+Cov(EX,YEX)=E(YVarX)+Cov(EX,YEX)=EYVarX.
Var(XY)=EVar(XY|Y)+VarE(XY|Y)=E(Y2(VarX|Y))+Var(Y(EX|Y))=E(Y2VarX)+Var(YEX)=E(Y2)VarX+(EX)2VarY=VarXVarY+(EY)2VarX+(EX)2VarY.
Y dapat diperlakukan sebagai konstanta dalam salah satu dari harapan, varian, atau kovariansi kondisional dalam di atas.

Dari kovarians dan varian di atas, korelasi dapat, setelah beberapa manipulasi aljabar, diekspresikan dengan baik dalam dua koefisien variasi sebagai

corr(X,XY)=11+VarY(EY)2(1+(EX)2VarX).

Pemeriksaan hasil ini dengan simulasi:

> n <- 1e+6
> x <- rexp(n,2)-2
> y <- rnorm(n,mean=5)
> cv2 <- function(x) var(x)/mean(x)^2
> 1/sqrt(1+cv2(y)*(1+1/cv2(x)))
[1] 0.844882
> cor(x,x*y)
[1] 0.8445373
Jarle Tufto
sumber
Bagus, tapi saya ingin menunjukkan beberapa hal: 1. Pada baris ketiga dari persamaan kedua, harus ada tanda kurung seperti dalam ? 2. Apakah Anda yakin bahwa orang yang mengajukan pertanyaan mengikuti alasan di balik langkah-langkah yang berbeda? Mis. demikian karena diberikan. Saya akan menyarankan penjelasan minimal untuk beberapa langkah. E(Y2VarX)+Var(YEX)ECov(X,XY|Y)=EYCov(X,X)Y
Antoni Parellada
1
Ya, saya menambahkan beberapa tanda kurung yang hilang dan beberapa penjelasan. Saya harus mengakui bahwa saya lebih suka jawaban @whuber.
Jarle Tufto
5

Dalam kasus spesifik X dan Y menjadi variabel acak dengan nol berarti, maka karena . KarenanyaE ( X 2 Y ) = E [ E [ X 2 Y | X ] ] = E [ X 2 E [ Y | X ] ] = 0 c o v ( X Y ) . E ( X ) = 0ρ(XY,X)=0E(X2Y)=E[E[X2Y|X]]=E[X2E[Y|X]]=0cov(XY,X)=E(X2Y)E(XY).E(X)=0

Kledou
sumber
-2

Korelasi Linear antara X dan XY adalah,

Corr (X, XY) = Cov (X, XY) / sqrt (var (X) * var (XY))

Cov (X, XY) = Penjumlahan ((X-mean (X)) (XY-mean (XY)) / n

n - ukuran sampel; var (X) = varian X; var (XY) = varian XY

Sam Gladio
sumber
1
Pertanyaannya adalah tentang variabel acak , bukan tentang data.
whuber
bagaimana kita dapat menemukan apakah 2 variabel acak berkorelasi atau tidak? Hanya data yang benar. Koreksi saya jika saya salah. Permintaan maaf.
Sam Gladio
Satu menghitung korelasi secara teoritis, menggunakan sifat matematika dari variabel acak. Ini sangat mirip dengan, katakanlah, menghitung kekuatan desain jembatan menggunakan prinsip-prinsip mekanika Newton, dibandingkan dengan membangun jembatan dan mengujinya: ada peran yang berbeda untuk teori dan data dan mereka tidak boleh bingung satu sama lain .
whuber