jika kovarians adalah -150, apa jenis hubungan antara dua variabel?

8

Kovarian dua variabel telah dihitung menjadi -150. apa yang dikatakan statistik tentang hubungan antara dua variabel?

Sameera
sumber
9
Kovarian tidak bebas unit, jadi nilai numerik mentah tidak menyampaikan makna sendiri. Selain dari fakta bahwa kurang dari 0, tidak banyak yang bisa dikatakan.
Glen_b -Reinstate Monica
9
Variabel saya memiliki rata-rata 317. Apakah besar atau kecil?
whuber

Jawaban:

34

Untuk menambah jawaban Łukasz Deryło : saat ia menulis, kovarians -150 menyiratkan hubungan negatif. Apakah ini hubungan yang kuat atau yang lemah tergantung pada varian variabel. Di bawah ini saya memplot contoh untuk hubungan yang kuat (masing-masing variabel terpisah memiliki varians 200, sehingga kovarians besar, secara absolut, dibandingkan dengan varians), dan untuk hubungan yang lemah (masing-masing varians adalah 2000, sehingga kovarians kecil , secara absolut, dibandingkan dengan varians).

Hubungan yang kuat, variance <- 200:

hubungan yang kuat

Hubungan yang lemah, variance <- 2000:

masukkan deskripsi gambar di sini

Kode R:

library(MASS)

nn <- 100
epsilon <- 0.1
variance <- 2000 # weak relationship

opar <- par(mfrow=c(2,2))
    for ( ii in 1:4 ) {
        while ( TRUE ) {
            dataset <- mvrnorm(n=100,mu=c(0,0),Sigma=rbind(c(2000,-150),c(-150,2000)))
            if ( abs(cov(dataset)[1,2]-(-150)) < epsilon ) break
        }   
        plot(dataset,pch=19,xlab="",ylab="",main=paste("Covariance:",cov(dataset)[1,2]))
    }
par(opar)

EDIT: Kuartet Anscombe

Sebagai catatan whuber, kovarian itu sendiri tidak benar-benar memberi tahu kita banyak tentang dataset. Sebagai ilustrasi, saya akan mengambil kuartet Anscombe dan memodifikasinya sedikit. Perhatikan bagaimana scatterplots yang sangat berbeda dapat memiliki kovarians (bulat) yang sama dengan -150:

Anscombe

anscombe.mod <- anscombe
anscombe.mod[,c("x1","x2","x3","x4")] <- sqrt(150/5.5)*anscombe[,c("x1","x2","x3","x4")]
anscombe.mod[,c("y1","y2","y3","y4")] <- -sqrt(150/5.5)*anscombe[,c("y1","y2","y3","y4")]
opar <- par(mfrow=c(2,2))
    with(anscombe.mod,plot(x1,y1,pch=19,main=paste("Covariance:",round(cov(x1,y1),0))))
    with(anscombe.mod,plot(x2,y2,pch=19,main=paste("Covariance:",round(cov(x2,y2),0))))
    with(anscombe.mod,plot(x3,y3,pch=19,main=paste("Covariance:",round(cov(x3,y3),0))))
    with(anscombe.mod,plot(x4,y4,pch=19,main=paste("Covariance:",round(cov(x4,y4),0))))
par(opar)

EDIT AKHIR (Saya berjanji!)

Akhirnya, inilah kovarians -150 dengan "hubungan negatif" yang paling lemah di antara keduanya x dan y yg ada:

terakhir

xx <- yy <- seq(0,100,by=10)
yy[9] <- -336.7
plot(xx,yy,pch=19,main=paste("Covariance:",cov(xx,yy)))
Stephan Kolassa
sumber
Sangat menyenangkan melihat plot. Dua saran: (1) menunjukkan rentang perilaku yang lebih luas. Karena kovarians sama sekali tidak memberi tahu kita tentang hubungan keseluruhan, Anda dapat mengilustrasikannya dengan memberikan satu pencilan yang berpengaruh untuk menggambarkan bagaimana hubungan itu bisa positif dan kuat secara konsisten , namun kovarians itu bisa negatif. (2) Lebih efisien: setelah menghasilkan data sampel, cukup skala ulang untuk mencapai kovarians yang diinginkan. Ini menyingkirkan pembuatan data berulang hingga ambang dipenuhi; itu menjamin nilai yang tepat ; dan itu menunjukkan betapa sedikitnya makna "-150" berlaku.
whuber
@whuber: Saya akan jujur ​​- saya terlalu bodoh untuk mencari tahu bagaimana mengubah dataset yang diberikan untuk mencapai kovarians yang diberikan. Googling dan mencari di CV tidak membantu, jadi pada akhirnya saya pergi dengan sampel penolakan brute force. Saya agak frustrasi dengan diri saya sendiri; setiap petunjuk akan dihargai.
Stephan Kolassa
Hanya sesuatu yang ditambahkan, apakah Anda melihat Datasaurus Dozen? Adalah versi kuartet Anscombe yang lebih dilebih-lebihkan yang diterbitkan awal tahun ini. Anda dapat menemukan publikasi online asli di sini
Guilherme Marthe
1
Saya, untuk satu, menganggap Anda sebagai kebalikan dari "bodoh" dan saya akan senang untuk menunjukkan satu metode. Anda dapat mengatur salah satu atau keduanyax dan y. Untuk melakukannya secara simetris, hasilkanx,ydata. Biarkan kovarians yang dikomputasi menjadiv. Tentukan "skala" menjadis=|-150/v| dan "tanda" kamu menjadi -1 kapan -150/v<0, 1jika tidak. Data(sx,kamusy) (yang akan mempertahankan urutan x dan mungkin membalikkan y) memiliki kovarians -150 karena
Cov(sx,kamusy)=s(kamus)Cov(x,y)=kamus2v=±kamu(-150v)v=-150
(+1 untuk hasil edit, btw.)
whuber
@Guilherme Dalam jawaban di stats.stackexchange.com/a/152034/919, saya melampaui semua itu dengan menyediakan peranti lunak yang akan menghasilkan contoh seperti itu hanya dengan menentukan properti yang Anda inginkan. Sebagai contoh, saya menggunakan kode untuk mereproduksi Kuartet Anscombe.
whuber
7

Ini hanya memberi tahu Anda bahwa hubungan itu negatif. Ini berarti bahwa nilai rendah dari satu variabel cenderung terjadi bersama dengan nilai tinggi lainnya.

Sulit untuk mengatakan apakah kovarians ini besar atau kecil (jika hubungan Anda kuat atau lemah) karena cHaiv(X,Y) rentang dari -sd(X)sd(Y) untuk sd(X)sd(Y). Jadi itu tergantung pada skala variabel Anda.

Untuk menilai apakah hubungan ini kuat atau tidak, Anda perlu mengubah kovarians menjadi korelasi (bagi dengan sd(X)sd(Y)). Ini berkisar dari-1 untuk 1 dan banyak pedoman interpretasi yang berbeda dapat ditemukan di Web dan buku teks.

Anda dapat menjalankan uji signifikansi korelasi juga.

Łukasz Deryło
sumber
2
Penafsiran ini, meskipun umum, membingungkan artinya dengan kecenderungan umum. Kovarians dapat dengan mudah menjadi negatif bahkan ketika sebagian besar data mengikuti hubungan positif.
whuber
Wikipedia: Koefisien korelasi Pearson
Paul