Bagaimana cara membandingkan kekuatan dua korelasi Pearson?

10

Saya telah ditanya oleh reviewer apakah korelasi Pearson (nilai-r) yang disajikan dalam tabel dapat dibandingkan satu sama lain sehingga orang dapat mengklaim bahwa yang satu "lebih kuat" dari yang lain (selain hanya mengamati nilai r yang sebenarnya) .

Bagaimana Anda melakukannya? Saya telah menemukan metode ini

http://vassarstats.net/rdiff.html

tetapi tidak yakin apakah ini berlaku.

pecorino
sumber
2
Apakah dua korelasi Anda dihitung dari sampel pengamatan yang sama?
Dimitriy V. Masterov
Sesuatu seperti interval kepercayaan untuk perbedaan bisa berhasil. Anda dapat menggunakan simulasi dengan beberapa asumsi distribusi, atau perkiraan normal asimptotik. Dalam sampel besar, Anda bisa menggunakan bootstrap.
Glen_b -Reinstate Monica
AFAIK menurunkan CI dari skor z dan mengubah-balik z ke r untuk CI pada pekerjaan rs. Bahkan untuk CI bootstrap, mungkin pantas untuk terlebih dahulu mengubahnya.
Jona

Jawaban:

22

(Saya menganggap Anda sedang berbicara tentang r yang diperoleh dari sampel.)

Tes di situs web itu berlaku dalam arti bahwa ia memperlakukan r seperti parameter apa pun yang nilainya mungkin berbeda antara dua populasi. Bagaimana r berbeda dari ukuran lain, seperti mean, yang Anda sangat percaya diri dalam membandingkan, menggunakan uji- t ? Yah, ini berbeda karena terikat antara -1,1, ia tidak memiliki distribusi yang tepat, jadi Anda perlu Fisher mengubahnya sebelum melakukan inferensi (dan kembali mengubahnya setelah itu, jika Anda ingin misalnya mendapatkan CI). Skor z yang dihasilkan dari tes memiliki formulir yang tepat untuk melakukan inferensi. Itulah yang sedang dilakukan tes yang Anda tautkan.

Jadi yang Anda tautkan adalah prosedur untuk menyimpulkan apa yang mungkin terjadi jika Anda bisa mendapatkan r untuk keseluruhan populasi dari mana Anda mengambil sampel - apakah r untuk satu kelompok lebih tinggi daripada yang lain, atau akan mereka persis sama? Sebut saja hipotesis ini nanti, H . Jika tes mengembalikan nilai p rendah , itu menyiratkan bahwa berdasarkan sampel Anda, Anda harus memiliki sedikit kepercayaan pada hipotesis bahwa nilai sebenarnya untuk perbedaan antara dua r akan tepat 0 (karena data seperti itu akan jarang terjadi jika perbedaan r persis 0). Jika tidak, Anda tidak memiliki data untuk menolak, dengan keyakinan, hipotesis ini persis sama0r , baik karena itu benar dan / atau karena sampel Anda tidak cukup. Perhatikan bahwa saya bisa melakukan cerita yang sama tentang perbedaan cara (menggunakan uji- t ), atau ukuran lainnya.

Pertanyaan yang sama sekali berbeda adalah apakah perbedaan antara keduanya akan bermakna . Sayangnya, tidak ada jawaban langsung untuk ini, dan tidak ada tes statistik yang dapat memberikan Anda jawabannya. Mungkin nilai sebenarnya (nilai populasi, bukan yang Anda amati) dari r adalah 0,5 dalam satu, dan 0,47 pada kelompok lain. Dalam hal ini, hipotesis statistik kesetaraannya ( ) akan salah. Tetapi apakah ini perbedaan yang berarti ? Itu tergantung - apakah ada sesuatu di urutan 3% lebih dijelaskan varians bermakna, atau tidak berarti? Cohen telah memberikan pedoman kasar untuk menafsirkan r (dan mungkin, perbedaan antara r0's), tetapi melakukannya hanya di bawah saran bahwa ini hanyalah titik awal. Dan Anda bahkan tidak tahu perbedaan pastinya, bahkan jika Anda melakukan beberapa inferensi, misalnya dengan menghitung CI untuk perbedaan antara dua korelasi. Kemungkinan besar, serangkaian kemungkinan perbedaan akan kompatibel dengan data Anda.

Taruhan yang relatif aman adalah menghitung interval kepercayaan untuk r Anda dan mungkin CI untuk perbedaan mereka, dan membiarkan pembaca memutuskan.

jona
sumber
4
Saya tidak tahu apakah Anda seorang guru, tetapi Anda seharusnya. Ini mudah dipahami, bahkan untuk seseorang yang memiliki pengetahuan dasar statistik berkat penjelasan Anda yang luar biasa.
serangan udara