Bisakah kita membandingkan korelasi antar kelompok dengan membandingkan kemiringan regresi?

10

Dalam pertanyaan ini mereka bertanya bagaimana cara membandingkan Pearson r untuk dua kelompok independen (seperti laki-laki vs perempuan). Balas dan komentar menyarankan dua cara:

  1. Gunakan rumus Fisher yang terkenal menggunakan "z-tranformation" dari r;
  2. Gunakan perbandingan lereng (koefisien regresi).

Yang terakhir dapat dengan mudah dilakukan hanya melalui model linier jenuh: , di mana X dan Y adalah variabel berkorelasi dan G adalah variabel dummy (0 vs 1) yang menunjukkan dua kelompok . Besarnya d (koefisien istilah interaksi) adalah persis perbedaan koefisien b setelah Model Y = a + b X dilakukan dalam dua kelompok secara individual, dan yang ( dY=a+bX+cG+dXGXYGdbY=a+bXdSignifikansi dengan demikian adalah ujian perbedaan kemiringan antara kelompok.

Sekarang, kemiringan atau koefisien regresi. belum merupakan koefisien korelasi. Tetapi jika kita menstandarisasi dan Y - secara terpisah dalam dua kelompok - maka d akan sama dengan perbedaan r dalam kelompok 1 dikurangi r dalam kelompok 0 dan oleh karena itu signifikansinya akan menguji perbedaan antara dua korelasi: kita menguji lereng tetapi muncul [seolah-olah -?] kami sedang menguji korelasi.XYd

Apakah itu yang saya tulis benar?

Jika ya, masih ada pertanyaan yang merupakan tes korelasi yang lebih baik - yang ini dijelaskan atau yang Fisher? Karena mereka akan menghasilkan hasil yang tidak sama. Bagaimana menurut anda?

Sunting Kemudian: Berterimakasihlah kepada @Wolfgang atas jawabannya. Namun, saya merasa saya kehilangan pemahaman mengapa uji Fisher lebih tepat untuk r daripada uji perbandingan dengan slope-under-standardisasi yang dijelaskan di atas. Jadi, lebih banyak jawaban diterima. Terima kasih.

ttnphns
sumber

Jawaban:

10

Segala sesuatu yang Anda tulis benar. Anda selalu dapat menguji hal-hal seperti itu dengan contoh mainan. Berikut ini adalah contoh dengan R:

library(MASS)

rho <- .5  ### the true correlation in both groups

S1 <- matrix(c( 1,   rho,   rho, 1), nrow=2)
S2 <- matrix(c(16, 4*rho, 4*rho, 1), nrow=2)

cov2cor(S1)
cov2cor(S2)

xy1 <- mvrnorm(1000, mu=c(0,0), Sigma=S1)
xy2 <- mvrnorm(1000, mu=c(0,0), Sigma=S2)

x <- c(xy1[,1], xy2[,1])
y <- c(xy1[,2], xy2[,2])
group <- c(rep(0, 1000), rep(1, 1000))

summary(lm(y ~ x + group + x:group))

Apa yang akan Anda temukan bahwa interaksi itu sangat signifikan, meskipun korelasi sebenarnya sama pada kedua kelompok. Mengapa itu terjadi? Karena koefisien regresi mentah dalam dua kelompok tidak hanya mencerminkan kekuatan korelasi, tetapi juga skala X (dan Y) dalam dua kelompok. Karena perbedaan tersebut berbeda, interaksi menjadi signifikan. Ini adalah poin penting, karena sering diyakini bahwa untuk menguji perbedaan dalam korelasi, Anda hanya perlu menguji interaksi dalam model di atas. Ayo lanjutkan:

summary(lm(xy2[,2] ~ xy2[,1]))$coef[2] - summary(lm(xy1[,2] ~ xy1[,1]))$coef[2]

Ini akan menunjukkan kepada Anda bahwa perbedaan dalam koefisien regresi untuk model yang dipasang secara terpisah dalam dua kelompok akan memberi Anda nilai yang persis sama dengan istilah interaksi.

Apa yang kami benar-benar tertarik adalah perbedaan dalam korelasi:

cor(xy1)[1,2]
cor(xy2)[1,2]
cor(xy2)[1,2] - cor(xy1)[1,2]

Anda akan menemukan bahwa perbedaan ini pada dasarnya adalah nol. Mari standarisasi X dan Y dalam dua kelompok dan perbaiki model lengkap:

x <- c(scale(xy1[,1]), scale(xy2[,1]))
y <- c(scale(xy1[,2]), scale(xy2[,2]))
summary(lm(y ~ x + x:group - 1))

Perhatikan bahwa saya tidak termasuk intersep atau efek utama grup di sini, karena mereka nol menurut definisi. Anda akan menemukan bahwa koefisien untuk x sama dengan korelasi untuk kelompok 1 dan koefisien untuk interaksi sama dengan perbedaan dalam korelasi untuk kedua kelompok.

Sekarang, untuk pertanyaan Anda apakah akan lebih baik menggunakan pendekatan ini dibandingkan menggunakan tes yang memanfaatkan transformasi r-to-z Fisher.

EDIT

ρ1=ρ2=0ρ1=ρ20α±1

Kesimpulan: Jika Anda ingin menguji perbedaan dalam korelasi, gunakan transformasi r-to-z Fisher dan uji perbedaan antara nilai-nilai tersebut.

Wolfgang
sumber
Apakah transformasi Fisher memiliki kelebihan dibandingkan tes lainnya?
mark999
Ternyata saya agak terlalu cepat. Lihat hasil edit saya. Semoga semoga menjawab pertanyaan Anda.
Wolfgang
Jadi, @ Wolfgang, Anda berpendapat bahwa perbandingan-of-slope-under-standardisasi adalah perbandingan r yang valid. Alternatif terkenal Fisher sebenarnya perkiraan itu. Apakah saya mengerti Anda?
ttnphns
Lihat hasil edit saya. Saya terlalu cepat dengan kesimpulan awal saya.
Wolfgang
@ Wolfgang, kemudian menambahkan EDIT dari balasan Anda menyatakan bahwa Fisher lebih baik. Pendekatan perbandingan-of-slope-under-standardisasi tidak memadai karena "kesalahan standar ... ketika Anda melakukan standarisasi ... jangan mempertimbangkan standardisasi ini". Tolong jelaskan kepada saya bagaimana mereka harus mempertimbangkan standardisasi sehingga perbandingan-dari-kemiringan-bawah-standardisasi menjadi sama validnya dengan uji Fisher.
ttnphns