Apakah ada batasan pada korelasi Spearman dari jumlah dua variabel?

8

Dengan vektor sedemikian rupa sehingga koefisien korelasi Spearman dari dan adalah , adakah batas-batas yang diketahui pada koefisien Spearman dari dengan , dalam hal (dan , mungkin)? Yaitu, dapatkah seseorang menemukan (non-sepele) fungsi sedemikian rupa sehingga nx,y1,y2xyiρi=ρ(x,yi)xy1+y2ρinl(ρ1,ρ2,n),u(ρ1,ρ2,n)

l(ρ1,ρ2,n)ρ(x,y1+y2)u(ρ1,ρ2,n)

sunting : contoh per @ whuber dalam komentar, tampaknya dalam kasus umum, hanya batas sepele dapat dibuat. Jadi, saya ingin memaksakan batasan lebih lanjut:l=1,u=1

  • y1,y2 adalah permutasi dari bilangan bulat .1n
shabbychef
sumber
2
Hanya mengetahui , interval yang berisi harus menyertakan dan : untuk setiap bisa memiliki nilai yang sangat kecil (sambil memiliki urutan peringkat apa pun), dan dengan demikian cukup "jitter" nilai-nilai dalam ketika ditambahkan ke . Dengan demikian urutan-peringkat tidak akan terpengaruh. Saya tidak tahu apakah intervalnya dapat melebihi . ρ1,ρ2ρ(x,y1+y2)ρ1ρ2y1,y2y1y1y1ρi
caracal
2
@caracal Observasi yang bagus. Interval pasti bisa lebih luas daripada : pertimbangkan saja kasus di mana kedua korelasi tersebut nol. Korelasi dengan penjumlahan dapat dengan mudah menjadi nol - dapat berkisar dari -1 hingga 1. Misalnya, x = (1,2,3,4,5); y1 = (3, -10,2,10,1); y2 = (-8,9, -2, -9,4); y1 + y2 = (-5, -1,0,1,5) memiliki tetapi . ρiρ1=ρ2=0ρ=1
Whuber
@whuber: ini tampaknya menyiratkan hanya batas-batas sepele yang ada (yaitu ). Mungkin saya harus melempar kendala lain pada masalahnya. l=1,u=1
shabbychef
@shabbychef Tidak, Anda telah memposting masalah yang bagus: ini tidak sepele. Dalam kasus , misalnya, satu - satunya kemungkinan adalah . Saya curiga batasannya tidak trivial kecuali ketika ; mereka harus menjadi lebih sempit ketika dan mendekati . ρ1=ρ2=1ρ=1ρ1=ρ2=0ρ1ρ2±1
Whuber
1
Ini kasus patologis lainnya. Misalkan dan . Kemudian , tetapi dan . Mungkin mencerahkan untuk memikirkan versi masalah yang lebih sederhana dan probabilistik. Misalkan , , dan menjadi variabel acak, masing-masing dengan distribusi yang sedikit seragam. Sekarang, biarkan menjadi CDF . Apa yang bisa kita katakan tentang berdasarkan pada dan ? x=y1y1=y2ρ(x,y1+y2)=0ρ1=1ρ2=1XY1Y2GY1+Y2Cov(X,G(Y1+Y2))Cov(X,Y1)Cov(X,Y2)
vqv

Jawaban:

4

Korelasi peringkat Spearman hanyalah korelasi product-moment Pearson antara peringkat variabel. Batasan ekstra Shabbychef berarti bahwa dan sama dengan peringkat mereka dan tidak ada ikatan, sehingga mereka memiliki standar deviasi yang sama (katakanlah). Jika kita juga mengganti x dengan peringkatnya, masalahnya menjadi masalah yang setara untuk korelasi momen-produk Pearson. Dengan definisi korelasi product-moment Pearson, y1y2σy

ρ(x,y1+y2)=Cov(x,y1+y2)σxVar(y1+y2)=Cov(x,y1)+Cov(x,y2)σxVar(y1)+Var(y2)+2Cov(y1,y2)=ρ1σxσy+ρ2σxσyσx2σy2+2σy2ρ(y1,y2)=ρ1+ρ22(1+ρ(y1,y2))1/2.
Untuk setiap set dari tiga variabel, jika kita tahu dua dari tiga korelasi mereka, kita dapat menempatkan batas pada korelasi ketiga (lihat misalnya Vos 2009 , atau dari rumus untuk korelasi parsial ):
ρ1ρ21ρ121ρ22ρ(y1,y2)ρ1ρ2+1ρ121ρ22
Karenanya jika ; jika Anda perlu mengganti batas.
ρ1+ρ22(1+ρ1ρ2+1ρ121ρ22)1/2ρ(x,y1+y2)ρ1+ρ22(1+ρ1ρ21ρ121ρ22)1/2
ρ1+ρ20ρ1+ρ20
onestop
sumber
Tetapi masalah sebenarnya adalah bahwa peringkat tidak bertambah. Lihat komentar saya untuk pertanyaan.
vqv
@vqv tetapi jika dan adalah permutasi dari bilangan bulat maka mereka persis sama dengan peringkat mereka. y1y21n
onestop
setengah jumlah permutasi tidak harus berupa permutasi; Tapi ini sangat dekat, dan saya menjawab pertanyaan untuk Pearson.
shabbychef
Nilai peringkat secara umum merupakan fungsi nonlinear dari - bahkan jika dan masing-masing merupakan permutasi dari bilangan bulat . Berikut ini sebuah contoh: dan . Kemudian dan . Plot melawan dan Anda akan melihat bahwa tidak ada hubungan linear antara keduanya. Penegasan di atas bahwa secara umum salah , bahkan dengan asumsi bahway1+y2y1+y2y1y21,,ny1=(1,2,3,4)y2=(2,3,1,4)y1+y2=(3,5,4,8)rank(y1+y2)=(1,3,2,4)y1+y2rank(y1+y2)ρ(x,y1+y2)=Cov(x,y1+y2)/ y1dan adalah permutasi bilangan bulat. y2
vqv
@vqv Anda benar. Aku terlalu tergesa-gesa untuk mencoba jawaban sebelum berangkat untuk liburan Natal. Saya belum menemukan ketimpangan yang menghubungkan korelasi Pearson dari tiga variabel sebelumnya. Berikut referensi lain untuk itu lengkap dengan visualisasi 3D: jstor.org/stable/2684832 . Saya masih berpikir itu mungkin memiliki beberapa relevansi, jadi saya tidak akan menghapus jawaban saya, meskipun saya tidak bisa melihat bagaimana untuk memperbaikinya baik.
onestop