Apakah variabel acak berkorelasi jika dan hanya jika peringkat mereka berkorelasi?

20

Asumsikan adalah variabel acak kontinu dengan momen kedua terbatas. Versi populasi dari koefisien korelasi peringkat Spearman ρ_s dapat didefinisikan sebagai koefisien momen-produk Pearson dari probabilitas integral mengubah F_X (X) dan F_Y (Y) , di mana F_X, F_Y adalah cdf dari X dan Y , yaitu,X,YρsFX(X)FY(Y)FX,FYXY

ρs(X,Y)=ρ(F(X),F(Y)) .

Saya bertanya-tanya apakah orang dapat menyimpulkan itu secara umum

ρ(X,Y)0ρ(F(X),F(Y))0 ?

Yaitu, apakah kita memiliki korelasi linier jika dan hanya jika kita memiliki korelasi linier antara peringkat?

Pembaruan: Dalam komentar dua contoh diberikan alasannya

ρ(FX(X),FY(Y))=0ρ(X,Y)=0

tidak benar secara umum, bahkan jika X dan Y memiliki distribusi yang sama. Jadi pertanyaannya harus dirumuskan kembali sebagai

ρ(X,Y)=0ρ(FX(X),FY(Y)) ?

Juga sangat menarik bagi saya apakah ini benar / salah jika X dan Y memiliki distribusi yang sama.

(Catatan: Jika X dan Y adalah kuadran positif, yaitu, δ(x,y)=FX,Y(x,y)FX(x)FY(y)>0 maka rumus kovarians Hoeffding, Cov(X,Y)=δ(x,y)dxdy menghasilkan bahwa ρ(X,Y)>0 dan ρ(F(X),F(Y))>0 )

FSpanhel
sumber
4
Petunjuk: Untuk mendapatkan jawaban, pikirkan tentang apa yang terjadi pada setiap ukuran korelasi di bawah transformasi monotonik yang sewenang-wenang.
kardinal
1
@ cardinal: yah, spearman rho invarian di bawah transformasi monotonik, koefisien korelasi linier klasik akan berubah, tetapi tidak jelas bagaimana (?) ... khususnya saya tidak tahu apakah nilai korelasi linier dapat mengubah nilainya dari nol menjadi bukan nol di bawah transformasi monotonik ... tapi mungkin saya melewatkan poin Anda?
FSpanhel
Anda berada di jalur yang benar! Biarkan dan . Sekarang, perhatikan transformasi monoton keduanya. Saya belum secara eksplisit memeriksa, tetapi kemungkinan akan berfungsi. XN(0,1)Y=X2g(z)=exp(z/2)
kardinal
2
Kamu benar. Contoh kedua tidak berhasil seperti yang saya maksudkan / curigai. Namun, prinsip umum tentang cara membangun sampel tandingan semacam itu masih berlaku. Dan, ya, masalah ini bisa diikat erat dengan kopula. :-)
kardinal
2
Setelah Anda mengkonfirmasi contoh tandingan Anda, silakan pertimbangkan untuk menuliskannya dalam jawaban untuk posting ini. Saya akan senang untuk mengangkatnya. Tepuk tangan.
kardinal

Jawaban:

8

Tidak ada korelasi menjadi nol yang memberi tahu Anda banyak tentang yang lain, karena mereka 'membobot' data - terutama data ekstrem - sangat berbeda. Saya hanya akan bermain dengan sampel, tetapi contoh serupa dapat dibangun dengan distribusi bivariat / kopula.

1. Korelasi Spearman 0 tidak menyiratkan korelasi Pearson 0 :

Seperti disebutkan dalam pertanyaan, ada contoh dalam komentar, tetapi struktur dasarnya adalah "membangun sebuah kasus di mana korelasi Spearman adalah 0, kemudian mengambil titik ekstrem dan menjadikannya lebih ekstrem tanpa mengubah korelasi Spearman"

Contoh-contoh dalam komentar mencakup hal itu dengan sangat baik, tetapi saya hanya akan bermain dengan contoh yang lebih 'acak' di sini. Jadi pertimbangkan data ini (dalam R), yang oleh konstruksi memiliki korelasi Spearman dan Pearson 0:

x=c(0.660527211673069, 0.853446087136149, -0.00673848667511427, 
-0.730570343152498, 0.0519171047989013, 0.00190761493801791, 
-0.72628058443299, 2.4453231076856, -0.918072410495674, -0.364060229489348, 
-0.520696233492491, 0.659907250608776)
y=c(-0.0214697990371976, 0.255615059485107, 1.10561181413232, 0.572216886959267, 
-0.929089680725018, 0.530329993414123, -0.219422799586819, -0.425186120279194, 
-0.848952532832652, 0.859700836483046, -0.00836246690850083, 
1.43806947831794)

cor(x,y);cor(x,y,method="sp")
[1] 1.523681e-18
[1] 0

Sekarang tambahkan 1000 ke y [12] dan kurangi 0,6 dari x [9]; korelasi Spearman tidak berubah tetapi korelasi Pearson sekarang 0,1841:

  ya=y
  ya[12]=ya[12]+1000
  xa=x
  xa[9]=xa[9]-.6
  cor(xa,ya);cor(xa,ya,method="sp")
[1] 0.1841168
[1] 0

(Jika Anda ingin signifikansi kuat pada korelasi Pearson itu, cukup gandakan seluruh sampel beberapa kali.)

2. Korelasi Pearson 0 tidak menyiratkan korelasi Spearman 0 :

Berikut adalah dua contoh dengan korelasi Pearson nol tetapi korelasi Spearman yang bukan nol (dan sekali lagi, jika Anda ingin signifikansi kuat pada korelasi Spearman ini, gandakan seluruh sampel beberapa kali).

Contoh 1:

 x1=c(rep(-3.4566679074320789866,20),-2:5)
 y1=x1*x1
 cor(x1,y1);cor(x1,y1,method="spe")
[1] -8.007297e-17 
[1] -0.3512699   

poin pada parabola diatur untuk memberikan 0 Pearson, tetapi korelasi Spearman bukan nol

Contoh 2:

 k=16.881943016134132 
 x2=c(-9:9,-k,k)
 y2=c(-9:9,k,-k)
 cor(x2,y2);cor(x2,y2,method="spe")
[1] -9.154471e-17
[1] 0.4805195

poin pada ay = x line, kecuali yang terkecil dan terbesar yang terletak pada y = -x

Dalam contoh terakhir ini, korelasi Spearman dapat dibuat lebih kuat dengan menambahkan lebih banyak poin pada y = x sambil membuat dua poin di kiri atas dan kanan bawah lebih ekstrim untuk mempertahankan korelasi Pearson pada 0.

Glen_b -Reinstate Monica
sumber